<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog - MRS Design Studio &#187; SEO e Motores de Busca</title>
	<atom:link href="http://mrsdesignstudio.com.br/blog/category/seo-e-motores-de-busca/feed/" rel="self" type="application/rss+xml" />
	<link>http://mrsdesignstudio.com.br/blog</link>
	<description></description>
	<lastBuildDate>Wed, 02 Feb 2011 13:37:26 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>As 15 melhores ferramentas de SEO para principiantes</title>
		<link>http://mrsdesignstudio.com.br/blog/as-15-melhores-ferramentas-de-seo-para-principiantes/</link>
		<comments>http://mrsdesignstudio.com.br/blog/as-15-melhores-ferramentas-de-seo-para-principiantes/#comments</comments>
		<pubDate>Sat, 22 Aug 2009 17:47:54 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[SEO e Motores de Busca]]></category>

		<guid isPermaLink="false">http://mrsdesignstudio.com.br/blog/?p=19</guid>
		<description><![CDATA[A optimização para motores de busca é um processo extremamente importante na projecção e dinâmica de um blog. Diria mesmo que é hoje uma ferramenta fundamental da ascenção e protagonismo de determinados modelos de negócio, pelo que é importante tentar perceber como funciona, de que forma pode ser utilizada, quais as melhores ferramentas a usar, [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: justify;">A optimização para motores de busca é um processo extremamente importante na projecção e dinâmica de um blog. Diria mesmo que é hoje uma ferramenta fundamental da ascenção e protagonismo de determinados modelos de negócio, pelo que é importante tentar perceber como funciona, de que forma pode ser utilizada, quais as melhores ferramentas a usar, entre outras coisas.<br />
Aproveito para o recomendar a ler a secção de <a href="http://www.fique-rico.com/category/seo-e-motores-de-busca/" target="_blank">SEO e Motores de busca</a> aqui do blog, onde encontrará seguramente artigos e informação técnica capaz de o ajudar a decifrar algumas das dúvidas que provavelmente irá ter.
</p>
<p><span id="more-19"></span></p>
<p style="text-align: justify;">Em paralelo com este artigo, gostaria de lhe sugerir outros dois artigos também para principiantes, entre eles as <a href="http://www.fique-rico.com/2008/10/09/12-tecnicas-de-seo-que-devera-evitar-utilizar-nos-seus-blogs-e-sites/" target="_blank">12 técnicas de SEO básicas para blogs</a> e também os <a href="http://www.fique-rico.com/2008/07/11/alguns-erros-de-seo-geralmente-cometidos-por-bloggers/" target="_blank">erros de SEO geralmente cometidos por blogueiros</a>. Penso que em conjunto com este artigo, são seguramente uma aposta válida na sua formação imediata.</p>
<p style="text-align: justify;">Entretanto e se ainda não entende muito sobre optimização para motores de busca, deixe-me recordar-lhe que alguns estudos referem que os visitantes dos motores de busca geralmente não pesquisam mais do 3 páginas de resultados, o que significa que se o seu blog estiver mal posicionado, será seguramente penalizado por isso em termos de tráfego e potencial orgânico.<br />
Vamos então analisar 15 ferramentas que podem ajudá-lo a melhorar o seu rankeamento nos motores de busca.</p>
<div style="text-align: justify;">
<dl style="width: 580px;">
<dt><img title="mercado pesquisas" src="http://www.fique-rico.com/images/mercadopesquisas.png" alt="mercado pesquisas" width="570" height="285" /></dt>
</dl>
<p><em>Créditos Imagem: <a href="http://www.mestreseo.com.br/otimizacao-de-sites" target="_blank">Mestre SEO</a></em><br />
<strong><span style="color: #ff0000;">VERIFICADOR DE PAGERANK</span></strong><br />
O <a href="http://www.prchecker.info/index.php" target="_blank">PageRank Checker</a> é uma ferramenta que lhe permite analisar rapidamente e com precisão, o pagerank de um determinado website ou de uma página específica. Embora seja possível fazê-lo automaticamente com a <a href="http://toolbar.google.com/" target="_blank">Google Toolbar</a> instalada no browser, este site tem a vantagem de estar disponível a qualquer momento, mesmo que esteja fora de casa por exemplo.<br />
O pagerank é um medidor de 0 a 10 valores, que mede entre outras coisas, a autoridade e credibilidade de um determinado website ou blog. O seu algoritmo é demasiado complexo e ainda desconhecido na sua totalidade.</div>
</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">PESQUISA COM PAGERANK</span></strong><br />
A ferramenta <a href="http://www.seochat.com/seo-tools/pagerank-search/" target="_blank">PageRank Search</a> é bastante interessante, uma vez que emula uma pesquisa orgânica do Google, tal e qual você faz no endereço da Google, mas oferece-lhe os resultados juntamente com uma barra de medição do pagerank das páginas apresentadas. Dessa forma você poderá analisar qual o pagerank e autoridade das páginas que aparecem nos primeiros resultados de determinadas pesquisas.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">VERIFICADOR DE PAGERANK INTERNO</span></strong><br />
A ferramenta <a href="http://seoanalytic.com/tools/internal_pagerank_checker/" target="_blank">Internal Pages PR Checker</a> permite-lhe entre outras coisas, verificar o nível de pagerank das suas páginas internas. Ele permite-lhe fazer uma filtração de todas as suas páginas, apresentando o pagerank de cada uma delas. Esta ferramenta pode ter interesse para melhorar o pagerank de determinadas páginas, bem como pesquisar por melhorias após uma actualização do PR.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">VERIFICADOR DE POPULARIDADE EM LINKS</span></strong><br />
O <a href="http://www.marketleap.com/publinkpop/default.htm" target="_blank">Link Popularity Checker</a> é uma ferramenta muito interessante que faz uma pesquisa global na procura de resultados que contenham links para o seu website ou blog, incluindo as suas própias páginas. Como provavelmente saberá, na optimização para motores de busca, os links são uma peça extremamente importante da sua equação.<br />
A popularidade do seu website é uma forma importante de medir também a autoridade que você tem nos resultados das pesquisas nos motores de busca.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">ANALISADOR DE BACKLINKS E TEXTOS ÂNCORA</span></strong><br />
O <a href="http://www.webconfs.com/anchor-text-analysis.php" target="_blank">Backlink Anchor Text Analyzer</a> é uma ferramenta que lhe permite analisar a web à procura de páginas que enviem links para si, citando também o texto âncora utilizado nesses mesmos links. Como já referi inúmeras vezes aqui no blog, O <a href="http://www.fique-rico.com/category/link-building/" target="_blank">Link Building</a> é uma das mais importantes estratégias de optimização para motores de busca, e tem um papel muito importante na construção de um site/blog equilibrado e autoritário.<br />
A verdade no entanto, é que sempre melhor ter poucos links mas de sites autoritários, do que muitos links de sites sem relevância ou autoridade perante os motores de busca.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">VERIFICAR DE LINKS PARCEIRO</span></strong><br />
Quando se faz troca de links ou se encontram parceiros interessados em trocar links como modelo de negócio, é importante manter os olhos bem abertos e verificar se esses mesmos parceiros continuam a cumprir a sua promessa e palavra. O <a href="http://www.webconfs.com/reciprocal-link-checker.php" target="_blank">Reciprocal Link Checker</a> é uma ferramenta que o ajuda a tentar perceber precisamente isso.<br />
Aproveito também para o alertar que o Google não considera tão importante a troca reciproca de links como considerava aqui há algum tempo, preferindo provavelmente uma estratégia do tipo: <em>site A ? site C, site C ? site B e site B ? site A</em>.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">DENSIDADE DE PALAVRAS-CHAVE</span></strong><br />
Uma das regras da optimização para motores de busca, é ter nos seus artigos uma densidade de palavras-chave a rondar os 3/5%. Se por ventura utilizar uma densidade muito superior, poderá ser considerado um spammer, enquanto que se utilizar uma densidade muito inferior, não irá sentir os resultados a aparecer, especialmente ao nível de pesquisas orgânicas.<br />
A ferramenta <a href="http://www.linkvendor.com/seo-tools/keyword-density.html" target="_blank">Keyword Density</a> ajuda-o a analisar de uma forma eficiente e automática o nível de palavras-chave e densidade presente nas suas páginas e/ou artigos, pelo que poderá ser uma excelente ajuda, inclusivamente na <a href="http://www.fique-rico.com/2008/08/06/7-dicas-para-optimizar-os-seus-artigos-mais-populares-de-sempre/" target="_blank">optimização de artigos mais antigos e populares</a>.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">ANÁLISE DE LINKS INTERNOS E EXTERNOS</span></strong><br />
A análise de links internos e externos é seguramente uma das formas mais importantes de aplicar o conceito de Link Building referido em cima. A ferramenta <a href="http://www.linkvendor.com/seo-tools/outbound-links.html" target="_blank">Link Analysis of External and Internal Links</a> é uma grande ajuda para quem procura equilibrar o seu site ou blog, mapeando todos os links internos e externos, juntamente com os seus textos âncora, colocando-os automaticamente numa tabela sumarizada.</p>
<p style="text-align: justify;"><script type="text/javascript">// < ![CDATA[
google_ad_client = "pub-9123101577288487";
/* 336x280TxtImg */
google_ad_slot = "3951803021";
google_ad_width = 336;
google_ad_height = 280;
// ]]&gt;</script> <script src="http://pagead2.googlesyndication.com/pagead/show_ads.js" type="text/javascript">
</script><script type="text/javascript">// < ![CDATA[
google_protectAndRun("ads_core.google_render_ad", google_handleError, google_render_ad);
// ]]&gt;</script><ins style="border: medium none; margin: 0pt; padding: 0pt; display: inline-table; height: 280px; position: relative; visibility: visible; width: 336px;"></ins>
</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">VERIFICADOR DE SINTAXE NO ROBOTS.TXT</span></strong><br />
Já ensinei aqui no blog <a href="http://www.fique-rico.com/2008/05/03/como-criar-um-ficheiro-robotstxt-para-o-seu-blog-ou-website/" target="_blank">como criar um ficheiro robots.txt para o seu blog</a>. No entanto e por vezes aquilo que criamos pode ficar longe daquilo que é o ideal aos olhos dos motores de busca. Para isso existe a ferramenta <a href="http://www.sxw.org.uk/computing/robots/check.html" target="_blank">Robots.txt Syntax Checker </a>que o ajuda a analisar o conteúdo dos seus robots.txt contra os standard ideais dos motores de busca, incluindo possíves erros de sintaxe.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">VERIFICADOR DE PLAGIARISMO</span></strong><br />
O <a href="http://www.copyscape.com/" target="_blank">Copyscape</a> é uma ferramenta interessante que o ajuda a encontrar artigos que tenham sido literalmente copiados do seu blog, através da verificação automatica de textos e frases chave. Ele ajuda-o a proteger-se inclusivamente de citações que possam ter sido feitas noutros blogs. É sem dúvida uma das melhores ferramentas na caça ao plagiarismo directo ou roubo de artigos.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">VERIFICADOR DE POSICIONAMENTO NAS PESQUISAS</span></strong><br />
A ferramenta <a href="http://www.marketleap.com/verify/default.htm" target="_blank">Search Engine Placement Check</a> ajuda-o a analisar directamente o seu posicionamento nos motores de busca para determinadas pesquisas, analisando apenas os resultados presentes nas primeiras 4 páginas de resultados de pesquisa. Como referi em cima, estar presente nas 3 primeiras páginas é muito importante.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">VERIFICADOR DE LINKS QUEBRADOS OU MALICIOSOS</span></strong><br />
Enviar links para sites e blogs pode parecer muito engraçado, mas a verdade é que após algum tempo existe a tendência de ficar com uma grande quantidade de links quebrados, ou porque a fonte encerrou, ou porque mudou de domínio, ou porque eliminou a página, entre outras coisas.<br />
No entanto a ferramenta <a href="http://www.bad-neighborhood.com/" target="_blank">Bad Neighborhood Check</a> ajuda-o a analisar o conteúdo todo do seu site ou blog, na procura de links que possam estar a penalizá-lo ao nível da autoridade e credibilidade. A sua utilização é seguramente uma das formas mais eficientes de melhorar o SEO do seu blog.</p>
<p style="text-align: justify;"><strong><span style="color: #ff0000;">ANÁLISE COMPLETA DE SITE OU BLOG</span></strong><br />
Já havia referido noutros artigos a ferramenta <a href="http://www.websitegrader.com/" target="_blank">Website Grader</a>, que considero extremamente interessante enquanto ajuda a blogueiros e webmasters. Esta ferramenta ajuda-o a analisar por completo o SEO do seu blog, apresentando resultados, problemas, factores e também um valor correspondente à eficiência do seu blog.
</p>
<p style="text-align: justify;">Estas são apenas algumas das milhentas opções disponíveis no mercado. Considero-as muito importantes numa abordagem inicial, mas também para todos aqueles que pretendem manter-se em cima do estado actual dos seus blogs. A optimização para motores de busca é um processo a longo prazo, pelo que é imprescindível a utilização de ferramentas como estas.</p>
<p style="text-align: justify;">Até já e bom SEO!</p>
<input id="gwProxy" type="hidden" />
<input id="jsProxy" onclick="jsCall();" type="hidden" />
<input id="gwProxy" type="hidden" />
<input id="jsProxy" onclick="jsCall();" type="hidden" />
]]></content:encoded>
			<wfw:commentRss>http://mrsdesignstudio.com.br/blog/as-15-melhores-ferramentas-de-seo-para-principiantes/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Semana do SEO &#8211; Gerindo o acesso dos Robots ao seu blog</title>
		<link>http://mrsdesignstudio.com.br/blog/semana-do-seo-gerindo-o-acesso-dos-robots-ao-seu-blog/</link>
		<comments>http://mrsdesignstudio.com.br/blog/semana-do-seo-gerindo-o-acesso-dos-robots-ao-seu-blog/#comments</comments>
		<pubDate>Sat, 15 Aug 2009 14:17:51 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[SEO e Motores de Busca]]></category>

		<guid isPermaLink="false">http://mrsdesignstudio.com.br/blog/?p=21</guid>
		<description><![CDATA[Controlar qual o conteúdo que deve ser bloqueado pelos motores de busca é um processo crucial para muitos websites e blogs. Felizmente, a grande maioria dos motores de busca e muitos robots observam aquilo a que se chama o Robots Exclusion Protocol (REP), que foi criado e envolvido organicamente nos anos 90 para providenciar uma [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: justify;">Controlar qual o conteúdo que deve ser bloqueado pelos motores de busca é um processo crucial para muitos websites e blogs. Felizmente, a grande maioria dos motores de busca e muitos robots observam aquilo a que se chama o <a href="http://www.robotstxt.org/" target="_blank">Robots Exclusion Protocol</a> (REP), que foi criado e envolvido organicamente nos anos 90 para providenciar uma série de controlos sobre partes e conteúdos de websites e blogs que os próprios robots dos motores de busca podem “scannar” e indexar, e vice-versa.</p>
<p><span id="more-21"></span></p>
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>1. CAPACIDADE DO REP</strong></span></p>
<p style="text-align: justify;">O protocólo de exclusão de Robots (REP) providencia controlos que podem ser aplicados ao nível do seu blog (robots.txt), ao nível da página (META tag, ou X-Robots-Tag), ou ao nível dos elementos HTML para controlar tanto a intensidade de “scan” do seu blog bem como a forma como o seu blog é listado nas páginas de resultados dos motores de busca (SERPs). <span style="color: #ff0000;"><strong>2. DECIDIR O QUE DEVE SER PRIVADO vs. PÚBLICO</strong></span><br />
Um dos primeiros passos em gerir os robots é decidir e perceber qual o conteúdo que deve ser Priva vs. Público. Comece por determinar que por defeito, todo o conteúdo é público, e posteriormente considere percepcionar quais os conteúdos que gostaria ou deveriam ser privados.</p>
<p style="text-align: justify;">Se pretende que os motores de busca acessem a todo o conteúdo seu blog, você não irá necessitar de um ficheiro robots.txt de todo. Quando um motor de busca tenta aceder a um ficheiro robots.txt no seu blog e o servidor não tem nenhum disponível (geralmente retornando um código 404 HTTP), o motor de busca passa a ter noção de que todo o conteúdo do seu blog deve ser “scannado” e encontrado.</p>
<p style="text-align: justify;">Todos os websites e blogs têm diferentes necessidades, pelo que não existe uma regra para definir o que colocar privado, mas existem alguns elementos comuns que podem ser postos em causa.</p>
<ul style="text-align: justify;">
<li><strong>Informação Privada</strong> – Você deverá ou poderá ter conteúdo no seu blog que não pretende que seja indexável pelos motores de busca. Por instantes, você poderá ter informação privada de utilizadores (como endereços) que você não pretende que fiquem disponibilizados gratuitamente na internet e nos motores de busca. Para este tipo de conteúdo, você poderá querer utilizar uma abordagem mais segura para manter os utilizadores de todas as páginas (como protecção com password por ex.). No entanto, alguns tipos de conteúdo são bons de ser acedidos pelos utilizadores, mas não o devem ser pelos motores de busca. Por instantes, você poderá querer criar um fórum de discussão que esteja disponível publicamente, mas pode desejar ao mesmo tempo que os posts individuais não fiquem disponíveis nos resultados dos motores de busca.</li>
<li><strong><a title="noncontent" name="noncontent"></a>Conteúdo não-conteúdo</strong> – Algum conteúdo, como por exemplo imagens utilizadas para navegação no seu blog, providenciam pouco interesse para os utilizadores dos e para os motores de busca. Não é problemático incluir estes elementos nos resultados de pesquisas dos motores de busca, mas uma vez que os motores de busca limitam a largura de banda para o crawl de cada site/blog e limitam também o espaço para armazenamento de cada site/blog, faz todo o sentido bloquear estes elementos para ajudar os robots a indexar o conteúdo que realmente vale a pena no seu blog.</li>
<li><strong>Páginas amigas da impressão</strong> – Se você tiver páginas específicas (URLs) que estão formatadas para impressão provavelmente deveria bloqueá-las para evitar duplicação de conteúdo. O grande problema prende-se com o facto de as páginas para impressão poderem aparecer nos resultados dos motores de pesquisa ao invés das páginas originais de conteúdo, o que poderá não providenciar uma experiência de qualidade aos utilizadores que o encontram nos resultados de pesquisas.</li>
<li><strong>Link de afiliado e Publicidade</strong> – Se incluir publicidade no seu site ou blog, poderá evitar que os robots sigam os links enviando-os para uma página bloqueada, ao invés de para a página de destino. (Existem outros métodos alternativos também, especialmente o NoFollow.)</li>
<li><strong>Páginas de Aterragem</strong> – O seu blog poderá incluir uma grande variação de páginas de entrada utilizadas essencialmente para propósitos de publicidade. Por instantes, poderá correr campanhas no Google AdWords que linkam para a página de aterragem onde se encontra a publicidade, ou poderá imprimir diferentes endereços URL para diferentes campanhas (para testes de tracking ou para relacionar o link com o anúncio). Uma vez que estas páginas são uma extensão dos anúncios, e são provavelmente duplicações da página original, poderá desejar bloquear estas páginas para evitar indexação de conteúdo duplicado.</li>
<li><strong>Páginas Experimentais</strong> – À medida que for experimentando novas ideias nos seus websites/blogs (utilizando testes A/B por ex.), poderá querer bloquear todas as página excepto a original de ser indexadas durante as suas experimentações.</li>
</ul>
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>3. IMPLEMENTANDO O REP</strong></span><br />
O REP é flexível e pode ser implementado de variadas formas. Esta flexibilidade permite-lhe facilmente especificar algumas políticas para todo o seu website/blog (ou subdomínio) e posteriormente utilizá-las de uma forma mais granular em cada página ou ao nível de links sempre que necessário.</p>
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>4. IMPLEMENTAÇÃO AO NÍVEL DE SITE/BLOG (ROBOTS.TXT)</strong></span><br />
As directivas panorâmicas para sites/blogs estão alojadas no ficheiro robots.txt, que deverá estar sempre localizado na raíz do seu servidor/diretorio para cada um dos seus domínios e sub-domínios. Note que os ficheiros robots.txt apenas se aplicam ao hostname onde são colocados, e não são aplicáveis por defeito aos subdomínos. Portanto, um ficheiro robots.txt localizado na raíz do seu blog, não se irá aplicar a um outro subdomínio que você utilize no mesmo blog, ainda que utilize o mesmo endereço URL. No entanto, o ficheiro robots.txt aplica-se a todas as pastas e subpastas e páginas dentro do mesmo hostname.</p>
<p style="text-align: justify;">Um ficheiro robots.txt é um ficheiro codificado em formato UTF-8 que contem entradas que consistem em linhas de “user-agent” (que diz ao robot do motor de busca se a entrada é direccionada a ele) e uma ou mais directivas que especificam conteúdo para o robot dos motores de busca para efectuar o crawling e a indexação regularmente. Um simples ficheiro robots.txt é mostrado a seguir.</p>
<blockquote style="text-align: justify;">
<pre>User-agent: *
Disallow: /private</pre>
</blockquote>
<p style="text-align: justify;">O <strong>User-Agent</strong> especifica a qual robot a entrada se aplica.</p>
<ul style="text-align: justify;">
<li>Pode definir o valor para <code>*</code> para especificar que a entrada se aplica a todos os robots dos motores de busca.</li>
<li>Pode definir o valor para um nome especifico de um robot para providenciar apenas instruções a esse robot. Pode encontrar uma listagem completa dos nomes dos robots em <a href="http://www.robotstxt.org/" target="_blank">robotstxt.org</a>.</li>
</ul>
<p style="text-align: justify;">A maior dos motores de busca tem múltiplos robots que efectuam o crawl da web para diferentes tipos de conteúdos (imagens, mobile, etc). Geralmente o início do nome dos robots é idêntico em todos, pelo que se você bloquear o “major robot”, todos os robots desse motor de busca serão bloqueados. No entanto, se você pretender bloquear apenas e especificamente um dado robot, poderá bloqueá-lo directamente e ainda assim permitir o acesso dos outros ao seu conteúdo.</p>
<ul style="text-align: justify;">
<li><strong><a href="http://www.google.com/support/webmasters/bin/answer.py?answer=40364" target="_blank">Google</a></strong> – O robot primário é o Googlebot.</li>
<li><strong><a href="http://help.yahoo.com/l/us/yahoo/search/webcrawler/slurp-02.html">Yahoo!</a></strong> – O robot primário é o Slurp.<strong> </strong></li>
</ul>
<p style="text-align: justify;"><code>Disallow: </code>- Especifica qual o conteúdo a bloquear</p>
<ul style="text-align: justify;">
<li>Deverá começar sempre com uma barra (<code>/</code>).</li>
<li>Bloqueia o acesso a quaisqueres URLs que comecem depois da barra <code>/</code>. Por momentos, <code>Disallow: /images</code> bloqueia o acesso à pasta <code>/images/</code>, <code>/images/image1.jpg</code>, e também à <code>/images10</code>.</li>
</ul>
<p style="text-align: justify;">Poderá especificar outras regras pra os robots dos motores de busca em adição às instruções por defeito que bloqueiam o acesso a conteúdo.</p>
<p style="text-align: justify;">Algumas coisas a notar na implementação dos robots.txt:</p>
<ul style="text-align: justify;">
<li>A maioria dos motores de busca suporta o chamado “pattern matching” utilizando o asterisco (*) como o cartão de acesso e o sinal de dólar ($) para o fim da sequência de matching.</li>
<li>O ficheiro robots.txt é case sensitive (sensível a minúsculas e maiúsculas), portanto <code>Disallow: /images </code>irá bloquear o acesso ao diretorio <code>http://www.examplo.com/images</code> mas não ao diretorio <code>http://www.examplo.com/Images</code>.</li>
<li>Se continuar conflictos no ficheiro, o robot irá obedecer à linha maior (e geralmente a mais especifica).</li>
</ul>
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>5. EXEMPLOS BÁSICOS</strong></span><em></em></p>
<p style="text-align: justify;"><em>Block all robots</em> – Ideal quando o seu website/blog ainda está em fase de pré-lançamento e não está pronto para receber tráfego orgânico.</p>
<blockquote style="text-align: justify;">
<pre># This keeps out all well-behaved robots.
# Disallow: * is not valid.
User-agent: *
Disallow: /</pre>
</blockquote>
<p style="text-align: justify;"><em>Keep out all bots by default</em> – Bloqueia todas as páginas excepto aqueles que são especificadas. Não é recomendado pela sua dificuldade de gestão e diagnóstico.</p>
<blockquote style="text-align: justify;">
<pre># Stay out unless otherwise stated
User-agent: *
Disallow: /
Allow: /Public/
Allow: /articles/
Allow: /images/</pre>
</blockquote>
<p style="text-align: justify;"><em>Block specific content</em> – O método mais comum de utilização do robots.txt.</p>
<blockquote style="text-align: justify;">
<pre># Block access to the images folder
User-agent: *
Disallow: /images/</pre>
</blockquote>
<p style="text-align: justify;"><a title="allow" name="allow"></a><em>Allow specific content</em> – Bloquear uma pasta, mas permitir o acesso a páginas dentro dessa pasta.</p>
<blockquote style="text-align: justify;">
<pre># Block everything in the images folder
# Except allow images/image1.jpg
User-agent: *
Disallow: /images/
Allow: /images/image1.jpg</pre>
</blockquote>
<p style="text-align: justify;"><em>Allow specific robot</em> – Bloqueie uma classe de robots (por instante, Googlebot), mas permita uma robot específico nessa classe (por instantes, Googlebot-Mobile).</p>
<blockquote style="text-align: justify;">
<pre># Block Googlebot access
# Allow Googlebot-Mobile access
User-agent: Googlebot
Disallow: /
User-agent: Googlebot-Mobile
Allow: /</pre>
</blockquote>
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>6. EXEMPLOS DE CORRESPONDÊNCIA DE PADRÕES</strong></span></p>
<p style="text-align: justify;">A maioria dos motores de busca suporta dois tipos de pattern matching.</p>
<ul style="text-align: justify;">
<li> <strong>*</strong> corresponde a qualquer sequência de caracteres</li>
<li> <strong>$</strong> corresponde ao final do endereço URL.</li>
</ul>
<p style="text-align: justify;"><em>Block access to URLs that contain a set of characters</em> – Utilize o asterisco (*) para especificar um cartão de acesso.</p>
<blockquote style="text-align: justify;">
<pre># Block access to all URLs that include an ampersand
User-agent: *
Disallow: /*&amp;</pre>
</blockquote>
<p style="text-align: justify;">Esta directiva irá impedir os motores de busca de efectuarem o crawling em <code>http://www.examplo.com/page1.asp?id=5&amp;sessionid=xyz</code>.</p>
<p style="text-align: justify;"><em>Block access to URLs that end with a set of characters</em> – Utilize o sinal de dólar ($) para especificar o final da linha.</p>
<blockquote style="text-align: justify;">
<pre># Block access to all URLs that end in .cgi
User-agent: *
Disallow: /*.cgi$</pre>
</blockquote>
<p style="text-align: justify;">Esta directiva irá impedir os motores de busca de efectuarem o crawling <code>http://www.examplo.com/script1.cgi</code> mas não de efectuar o crawling em <code>http://www.examplo.com/script1.cgi?value=1</code>.</p>
<p style="text-align: justify;"><em>Selectively allow access to a URL that matches a blocked pattern</em> – Utilize a directiva <code>Allow</code> em conjunção com o pattern matching para implementações mais complexas.</p>
<blockquote style="text-align: justify;">
<pre># Block access to URLs that contain ?
# Allow access to URLs that end in ?
User-agent: *
Disallow: /*?
Allow: /*?$</pre>
</blockquote>
<p style="text-align: justify;">Esta directiva irá bloquear todos os endereços URL que contenham <code>?</code> excepto aqueles que terminam em <code>?</code>. Neste exemplo, a versão por defeito da página será indexável:</p>
<ul style="text-align: justify;">
<li><code>http://www.examplo.com/productlisting.aspx?</code></li>
</ul>
<p style="text-align: justify;">As variações da página serão bloqueadas:</p>
<ul style="text-align: justify;">
<li><code>http://www.examplo.com/productlisting.aspx?nav=price</code></li>
<li><code>http://www.examplo.com/productlisting.aspx?sort=alpha</code></li>
</ul>
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>7. OUTRAS INSTRUÇÕES PARA ROBOTS<br />
</strong></span><span>Especifique um Sitemap ou ficheiro de Sitemap index</span> – se gostar de providenciar aos motores de busca uma lista compreensiva dos seus melhores endereços URLs, poderá providenciar um ou mais directivas de auto-descobrimento ao seu Sitemap. De notar, que o “user-agent” não é aplicável a esta diretoria pelo que não poderá utilizá-lo para especificar um Sitemap para apenas um motor de busca e não para todos.</p>
<blockquote style="text-align: justify;">
<pre># Please take my sitemap and index everything!
Sitemap: http://janeandrobot.com/sitemap.axd</pre>
</blockquote>
<p style="text-align: justify;"><em>Reduce the crawling load</em> – Este só trabalha com a Microsoft e Yahoo. Para a Google terá de especificar uma velocidade de crawling inferior através da consola <a href="http://google.com/webmaster" target="_blank">Webmaster Tools</a>. Tenha cuidado quando implementar isto se por ventura colocar o crawling demasiado lento, os robots não conseguiram “scannar” todo o seu conteúdo a tempo e poderá perder páginas para o index.</p>
<blockquote style="text-align: justify;">
<pre># MSNBot, please wait 5 seconds in between visits
User-agent: msnbot
Crawl-delay: 5
# Yahoo's Slurp, please wait 12 seconds in between visits
User-agent: slurp
Crawl-delay: 12</pre>
</blockquote>
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>8. IMPLEMENTAÇÕES AO NÍVEL DA PÁGINA (META TAGS)</strong></span></p>
<p style="text-align: justify;">As directivas ao nível de página do REP permitem-lhe redefinir as políticas do seu blog numa básica de página-por-página<em>.</em></p>
<p style="text-align: justify;"><em>Placing a meta tag on the page</em> – Coloque a meta tag na head tag. Cada directiva deve ser delimitada com uma vírgula dentro da tag. E.x. &lt;meta name=”ROBOTS” content=”Directiva1, Directiva2&gt;.</p>
<blockquote style="text-align: justify;">
<pre><span>&lt;</span><span>html</span><span>&gt;
</span><span>&lt;</span><span>head</span><span>&gt;
</span><span>&lt;</span><span>title</span><span>&gt;</span>Your title here<span>&lt;/</span><span>title</span><span>&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="NOINDEX"</span>&gt;
<span>&lt;/</span><span>head</span><span>&gt;
</span><span>&lt;</span><span>body</span><span>&gt;</span>Your page here<span>&lt;/</span><span>body</span><span>&gt;</span>
<span>&lt;/</span><span>html</span><span>&gt;</span></pre>
</blockquote>
<p style="text-align: justify;"><em>Targeting a specific search engine</em> – Entre a meta tag você poderá especificar qual o motor de busca que gostaria que fosse o seu alvo, ou então atirar em todos os alvos em simultâneo.</p>
<blockquote style="text-align: justify;">
<pre><span>&lt;!-- Applies to All Robots --&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="NOINDEX"</span><span>&gt;
</span><span>&lt;!-- ONLY GoogleBot --&gt;</span>
<span>&lt;</span><span>meta</span> <span>name</span><span>="Googlebot"</span> <span>content</span><span>="NOINDEX"</span><span>&gt;
</span><span>&lt;!-- ONLY Slurp (Yahoo) --&gt;</span>
<span>&lt;</span><span>meta</span> <span>name</span><span>="Slurp"</span> <span>content</span><span>="NOINDEX"</span><span>&gt;
</span><span>&lt;!-- ONLY MSNBot (Microsoft) --&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="MSNBot"</span> <span>content</span><span>="NOINDEX"</span><span>&gt;</span></pre>
</blockquote>
<p style="text-align: justify;"><em>Control how your listings</em> – Existem uma série de opções que podem ser configuradas para determinar como o seu blog aparece nos SERP. Você pode exercer controlo sobre a descrição e também removero link de “Cached page”.</p>
<blockquote style="text-align: justify;">
<pre><span>&lt;!-- Do not show a description for this page --&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="NOSNIPPET"</span><span>&gt;
</span><span>&lt;!-- Do not use http://dmoz.org to create a description --&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="NOODP"</span><span>&gt;
</span><span>&lt;!-- Do not present a cached version of the document in a search result --&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="NOARCHIVE"</span><span>&gt;</span></pre>
</blockquote>
<p style="text-align: justify;"><em>Using other directives</em> – Outras directivas para robots encontram-se de seguida.</p>
<blockquote style="text-align: justify;">
<pre><span>&lt;!-- Do not trust links on this page, could be user generated content (UCG) --&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="NOFOLLOW"</span><span>&gt;
</span><span>&lt;!-- Do not index this page --&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="NOINDEX"</span><span>&gt;
</span><span>&lt;!-- Do not index any images on this page (will still index the if they are linked </span>
<span>     elsewhere) Better to use Robots.txt if you really want them safe. </span><span>This is a Google Only tag. --&gt;</span><span>
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="GOOGLEBOT"</span> <span>content</span><span>="NOIMAGEINDEX"</span><span>&gt;
</span><span>&lt;!-- Do not translate this page into other languages--&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="NOTRANSLATE"</span><span>&gt;
</span><span>&lt;!-- NOT RECOMMENDED, there really isn't much point in using these --&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="FOLLOW"</span><span>&gt;
</span><span>&lt;</span><span>meta</span> <span>name</span><span>="ROBOTS"</span> <span>content</span><span>="UNAVAILABLE_AFTER"</span><span>&gt;
</span></pre>
</blockquote>
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>9. IMPLEMENTAÇÃO NO HEADER HTTP (X-ROBOTS-TAG)</strong></span><br />
Esta tag permite a programadores e desenvolvedores especificar directiva ao nível de página com o REP para conteúdo que não seja texto/html do tipo PDF, DOC, PPT, ou dinamicamente gerando imagens.</p>
<p style="text-align: justify;"><em>Using the X-Robots-Tag</em> – Para usar a tag X-Robots-Tag, simplesmente adicione-a ao header do seu blog como especificado em baixo. Para especificar múltiplas directivas poderá limitá-las com vírgula, ou adicioná-las como items separados no header.</p>
<blockquote style="text-align: justify;">
<pre>HTTP/1.x 200 OK
Cache-Control: private
Content-Length: 2199552
Content-Type: application/octet-stream
Server: Microsoft-IIS/7.0
content-disposition: inline; filename=01 - The truth about SEO.ppt
<strong>X-Robots-Tag: noindex, nosnippet
</strong>X-Powered-By: ASP.NET
Date: Sun, 01 Jun 2008 19:25:47 GMT</pre>
</blockquote>
<p style="text-align: justify;">A directiva da X-Robots-Tag suporta praticamente as mesmas directivas da meta tag. A única limitação com este método sobre a implementação da meta tag é que não existe forma de atingir um robot específico – pensando nisso, provavelmente não será uma grande oportunidade na maioria dos casos.</p>
<ul style="text-align: justify;">
<li><span style="font-family: Courier New;">X-Robots-Tag: noindex</span></li>
<li><span style="font-family: Courier New;">X-Robots-Tag: nosnippet</span></li>
<li><span style="font-family: Courier New;">X-Robots-Tag: notranslate</span></li>
<li><span style="font-family: Courier New;">X-Robots-Tag: noarchive</span></li>
<li><span style="font-family: Courier New;">X-Robots-Tag: unavailable_after: 7 Jul 2007 16:30:00 GMT</span></li>
</ul>
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>10. IMPLEMENTAÇÃO AO NÍVEL DO CONTEÚDO</strong></span><br />
Poderá ainda afinar as directivas ao nível de página e site/blog com variadas “content tags”, ou seja, tags de conteúdo.</p>
<p style="text-align: justify;">A tag de texto âncora (link) poderá ser modificada para dizer aos motores de busca que você não confia no endereço de destino desse URL. Esta utilização é feita quando não se pretende passar pagerank ou peso em links, e também em sites de conteúdo gerado pelos utilizadores, como por exemplo wikis, comentários de blogs, reviews, entre outros exemplos.</p>
<div style="text-align: justify;">
<pre>&lt;a href="#" rel="NOFOLLOW"&gt;Hyperlink&lt;/a&gt;</pre>
</div>
<p style="text-align: justify;">Ainda, no Yahoo Search poderá especificar qual os elementos da &lt;div&gt; numa página que não gostaria de ver indexados utilizando o atributo <code>class=robots-nocontent</code>. No entanto, não recomendamos a utilização desta tag por não ser suportada por outros motores de pesquisa, tornado-a dispensável.</p>
<div style="text-align: justify;">
<pre>&lt;div&gt;</pre>
<pre>Sem conteúdo para si! (ou pelo menos para o Yahoo!)</pre>
<pre>&lt;/div&gt;</pre>
</div>
<p style="text-align: justify;">
<p style="text-align: justify;"><span style="color: #ff0000;"><strong>CONCLUSÃO</strong></span><br />
Trabalhar com robots.txt e outras formas de indexação e bloqueio de informação pode parecer complexo, mas na verdade é muito simples e segue uma lógica padrão. Se por ventura tiver dúvidas na utilização de algum dos exemplos apresentados, dispare um comentário! Aproveite também para deixar a sua opinião sobre o artigo!</p>
<p style="text-align: justify;">Até Já!</p>
<input id="gwProxy" type="hidden" />
<input id="jsProxy" onclick="jsCall();" type="hidden" />
]]></content:encoded>
			<wfw:commentRss>http://mrsdesignstudio.com.br/blog/semana-do-seo-gerindo-o-acesso-dos-robots-ao-seu-blog/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

