<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Ataraxia! &#187; seo</title>
	<atom:link href="http://www.ataraxia.com.br/posts/tag/seo/feed" rel="self" type="application/rss+xml" />
	<link>http://www.ataraxia.com.br</link>
	<description>O estado da arte em TI</description>
	<lastBuildDate>Sun, 17 Jul 2011 21:36:57 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Evitando conteúdo duplicado</title>
		<link>http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado</link>
		<comments>http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado#comments</comments>
		<pubDate>Tue, 09 Jun 2009 13:30:04 +0000</pubDate>
		<dc:creator>Bruno Lustosa</dc:creator>
				<category><![CDATA[dicas]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[html]]></category>

		<guid isPermaLink="false">http://www.ataraxia.com.br/?p=342</guid>
		<description><![CDATA[Suponha que você tenha um site. E seu site possui páginas, que você anuncia através de um feed RSS, como por exemplo, o Feed RSS deste site, e também através de um boletim enviado por email periodicamente. Até aí, tudo ótimo. Até que chega um momento em que você decide contabilizar os usuários que chegam [...]]]></description>
			<content:encoded><![CDATA[<p>Suponha que você tenha um site. E seu site possui páginas, que você anuncia através de um feed <acronym title="Really Simple Syndication">RSS</acronym>, como por exemplo, o <a href="http://www.ataraxia.com.br/feed">Feed RSS deste site</a>, e também através de um boletim enviado por email periodicamente.<br />
Até aí, tudo ótimo.<br />
Até que chega um momento em que você decide contabilizar os usuários que chegam no seu site através do feed, ou através dos boletins.<br />
Uma alternativa bastante simples é adicionar uma variável qualquer no fim da URL das páginas anunciadas, para que seu site &#8220;saiba&#8221; de onde veio. Por exemplo, digamos que eu tenha escolhido esta página para anunciar. A URL desta página é:</p>
<p><a href="http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado">http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado</a></p>
<p>Para diferenciar, eu poderia usar URLs como as abaixo:</p>
<p><a href="http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado?rss">http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado?rss</a></p>
<p><a href="http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado?email">http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado?email</a></p>
<p>Desta forma, o site tem como saber de onde o visitante veio, bastando colocar no feed o sufixo &#8220;?rss&#8221;, e nos boletins o &#8220;?email&#8221;. O site checaria se a URL contém um desses sufixos, e incrementaria um contador em algum lugar (banco de dados, arquivo, etc).<br />
O grande problema, é que uma vez que os buscadores encontrem essas URLs alternativas, irão notar que o conteúdo é o mesmo para as 3 páginas, e existe a chance de que seu site seja penalizado por isso.<br />
Uma das formas de se lidar com isso é usar a tag &lt;link&gt; para informar qual é a URL &#8220;canônica&#8221; da página atual. A tag é simples:</p>

<div class="wp_syntax"><div class="code"><pre class="html4strict" style="font-family:monospace;"><span style="color: #009900;">&lt;<span style="color: #000000; font-weight: bold;">link</span> <span style="color: #000066;">rel</span><span style="color: #66cc66;">=</span><span style="color: #ff0000;">&quot;canonical&quot;</span> <span style="color: #000066;">href</span><span style="color: #66cc66;">=</span><span style="color: #ff0000;">&quot;http://www.example.org/caminho-da-pagina&quot;</span> <span style="color: #66cc66;">/</span>&gt;</span></pre></div></div>

<p>Esta tag é a mesma nas 3 páginas, e indica ao buscador qual é a URL canônica da página. Seguindo o nosso exemplo, nas 3 páginas acima, teríamos a tag:</p>

<div class="wp_syntax"><div class="code"><pre class="html4strict" style="font-family:monospace;"><span style="color: #009900;">&lt;<span style="color: #000000; font-weight: bold;">link</span> <span style="color: #000066;">rel</span><span style="color: #66cc66;">=</span><span style="color: #ff0000;">&quot;canonical&quot;</span> <span style="color: #000066;">href</span><span style="color: #66cc66;">=</span><span style="color: #ff0000;">&quot;http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado&quot;</span> <span style="color: #66cc66;">/</span>&gt;</span></pre></div></div>

<p>Claro, esta tag serve como uma &#8220;dica&#8221; para os buscadores, e eles podem usá-la ou não. Na maioria das vezes, ela será usada.<br />
E embora eu tenha dado o exemplo de páginas anunciadas por email ou feed RSS, a utilidade vai bem além disso.<br />
Se você tem um site, digamos de e-commerce, e tem uma página que ordena os produtos por preço, popularidade, etc, e essa ordenação é passada como parâmetro na URL, o conteúdo da página será essencialmente o mesmo, porém com a posição diferente (dependendo da ordenação). O buscador pode entender que a página é duplicada. Uma tag &lt;link&gt; como esta, apontando para a URL sem ordenação resolveria o problema.</p>
<h3  class="related_post_title">Artigos relacionados</h3><ul class="related_post"><li><a href="http://www.ataraxia.com.br/posts/otimizacao-imagens-inline" title="Otimização: imagens inline">Otimização: imagens inline</a></li><li><a href="http://www.ataraxia.com.br/posts/paginas-de-manutencao" title="Páginas de manutenção">Páginas de manutenção</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Páginas de manutenção</title>
		<link>http://www.ataraxia.com.br/posts/paginas-de-manutencao</link>
		<comments>http://www.ataraxia.com.br/posts/paginas-de-manutencao#comments</comments>
		<pubDate>Fri, 23 Jan 2009 16:38:29 +0000</pubDate>
		<dc:creator>Bruno Lustosa</dc:creator>
				<category><![CDATA[dicas]]></category>
		<category><![CDATA[http]]></category>
		<category><![CDATA[seo]]></category>

		<guid isPermaLink="false">http://blog.ataraxia.com.br/?p=168</guid>
		<description><![CDATA[Volta e meia, precisamos colocar nosso site em manutenção. Seja por um erro temporário em um banco de dados, ou algum outro problema de força maior, normalmente preparamos uma página especial para esse tipo de problema. A página, normalmente bem simples, informa ao visitante que o site está passando por problemas temporários, ou está em [...]]]></description>
			<content:encoded><![CDATA[<p>Volta e meia, precisamos colocar nosso site em manutenção. Seja por um erro temporário em um banco de dados, ou algum outro problema de força maior, normalmente preparamos uma página especial para esse tipo de problema.</p>
<p>A página, normalmente bem simples, informa ao visitante que o site está passando por problemas temporários, ou está em manutenção, e que voltará em breve.</p>
<p>Porém, uma coisa frequentemente ignorada é o que os buscadores percebem quando encontram uma página dessas. Ao chegar na página principal do seu site e se deparar com uma página dizendo que o site está temporariamente fora do ar, se os devidos cuidados não forem tomados, o robô irá indexar a página, e passará a figurar nas buscas.</p>
<p>Ou seja, ao invés de ter o conteúdo real da página no índice do buscador, teremos o conteúdo da página de erro, o que definitivamente não é o que desejamos.</p>
<p>Como fazer pra que isso não ocorra?</p>
<p>Pra falar a verdade, a resposta é bem simples: enviando o status <acronym title="Hypertext Transfer Protocol">HTTP</acronym> adequado para as páginas de erro. Da mesma forma que uma página não encontrada gera um erro 404, uma página indisponível deve gerar um erro 503, informando ao buscador ou cliente que a página é um erro temporário.</p>
<p>Isto pode ser feito em qualquer linguagem de programação, bastando alterar os cabeçalhos enviados. Em PHP, ficaria assim:</p>

<div class="wp_syntax"><div class="code"><pre class="php" style="font-family:monospace;"><span style="color: #000000; font-weight: bold;">&lt;?php</span>
<span style="color: #990000;">header</span><span style="color: #009900;">&#40;</span><span style="color: #0000ff;">&quot;HTTP/1.1 503 Service Unavailable&quot;</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">/</span>
<span style="color: #990000;">header</span><span style="color: #009900;">&#40;</span><span style="color: #0000ff;">&quot;Retry-After: 60&quot;</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
<span style="color: #000000; font-weight: bold;">?&gt;</span></pre></div></div>

<p>Para alterar para outra linguagem, basta pesquisar como se enviar cabeçalhos HTTP. Todas as linguagens de programação disponibilizam uma forma de se fazer isso.</p>
<p>A primeira linha informa o código de erro 503, que o navegador ou buscador irá interpretar como um erro temporário no servidor, e não como uma resposta normal (código 200).</p>
<p>Já a segunda, informa em quanto tempo, em segundos, o cliente deve retornar a página para ter o conteúdo real. Este cabeçalho é opcional, mas se dá pra se estimar o tempo necessário para que o erro seja sanado, é uma boa idéia colocá-lo. No caso, estou informando ao cliente que a página estará de volta em 1 minuto.</p>
<p>O mais importante, no caso, é que um buscador não irá indexar uma página com erro 503.</p>
<p>O <acronym title="World Wide Web Consortium">W3C</acronym> possui uma página com a <a href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html">explicação detalhada de todos os erros HTTP</a>.</p>
<h3  class="related_post_title">Artigos relacionados</h3><ul class="related_post"><li><a href="http://www.ataraxia.com.br/posts/evitando-conteudo-duplicado" title="Evitando conteúdo duplicado">Evitando conteúdo duplicado</a></li><li><a href="http://www.ataraxia.com.br/posts/otimizacao-de-sites-parte-3-cache" title="Otimização de sites, parte 3 &#8211; Cache">Otimização de sites, parte 3 &#8211; Cache</a></li><li><a href="http://www.ataraxia.com.br/posts/otimizacao-de-sites-parte-2-compressao" title="Otimização de sites, parte 2 &#8211; Compressão">Otimização de sites, parte 2 &#8211; Compressão</a></li><li><a href="http://www.ataraxia.com.br/posts/otimizacao-em-php-parte-1-minify" title="Otimização em PHP, parte 1: Minify">Otimização em PHP, parte 1: Minify</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ataraxia.com.br/posts/paginas-de-manutencao/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

