<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Ataraxia! &#187; memoria</title>
	<atom:link href="http://www.ataraxia.com.br/posts/tag/memoria/feed" rel="self" type="application/rss+xml" />
	<link>http://www.ataraxia.com.br</link>
	<description>O estado da arte em TI</description>
	<lastBuildDate>Sun, 17 Jul 2011 21:36:57 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Otimização de sites com memcached</title>
		<link>http://www.ataraxia.com.br/posts/otimizacao-de-sites-com-memcached</link>
		<comments>http://www.ataraxia.com.br/posts/otimizacao-de-sites-com-memcached#comments</comments>
		<pubDate>Sat, 16 May 2009 16:01:32 +0000</pubDate>
		<dc:creator>Bruno Lustosa</dc:creator>
				<category><![CDATA[programação]]></category>
		<category><![CDATA[bd]]></category>
		<category><![CDATA[memoria]]></category>
		<category><![CDATA[otimização]]></category>
		<category><![CDATA[sql]]></category>

		<guid isPermaLink="false">http://www.ataraxia.com.br/?p=328</guid>
		<description><![CDATA[Um projeto muito interessante, e que pode ser usado pra aumentar drasticamente o desempenho de aplicativos web é o Memcached. Pela descrição do site do projeto, o &#8220;memcached é um sistema distribuído de alto desempenho para o cacheamento de objetos na memória, genérico por natureza, mas feito para se aumentar a velocidade de sites dinâmicos [...]]]></description>
			<content:encoded><![CDATA[<p>Um projeto muito interessante, e que pode ser usado pra aumentar drasticamente o desempenho de aplicativos web é o <a href="http://www.danga.com/memcached/">Memcached</a>. Pela descrição do site do projeto, o &#8220;memcached é um sistema distribuído de alto desempenho para o <i>cacheamento</i> de objetos na memória, genérico por natureza, mas feito para se aumentar a velocidade de sites dinâmicos diminuindo a carga no banco de dados&#8221;.<br />
O memcached funciona como um grande dicionário, que armazena tuplas do tipo [chave, valor]. Para armazenar um objeto qualquer, basta conectar no memcached e passar uma chave para acessá-lo e o objeto (e opcionalmente outros parâmetros, como tempo de armazenamento). Para buscar o objeto, basta conectar ao memcached e pedir a ele o objeto que possui a chave previamente criada.<br />
Digamos que uma página web precise fazer algumas consultas pesadas em um banco de dados. A idéia é justamente pegar o resultado da consulta e jogar pra dentro do memcached. Na próxima vez que a consulta precisar ser feita, o programa irá primeiro checar se o resultado já está disponível no memcached. Se estiver, ótimo, economizamos uma query pesada. Se não estiver, o programa faz a consulta e guarda o resultado no memcached. Simples assim!</p>
<h2>Exemplo em PHP</h2>
<p>O memcached pode ser acessado de muitas linguagens de alto nível, como C/C++, Java, Python, PHP, e até .NET. Abaixo, um exemplo em PHP.<br />
Antes do memcache, uma página poderia ter uma consulta do seguinte tipo:</p>

<div class="wp_syntax"><div class="code"><pre class="php" style="font-family:monospace;"><span style="color: #000000; font-weight: bold;">&lt;?php</span>
<span style="color: #666666; font-style: italic;">// A query SQL está abreviada, apenas como exemplo</span>
<span style="color: #666666; font-style: italic;">// Digamos que essa consulte demore cerca de 1 segundo</span>
<span style="color: #666666; font-style: italic;">// para ser completada</span>
<span style="color: #000088;">$sql</span> <span style="color: #339933;">=</span> <span style="color: #0000ff;">&quot;SELECT * FROM tabela INNER JOIN ......&quot;</span><span style="color: #339933;">;</span>
<span style="color: #000088;">$res</span> <span style="color: #339933;">=</span> <span style="color: #990000;">pg_query</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$sql</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
<span style="color: #000088;">$arr</span> <span style="color: #339933;">=</span> <span style="color: #990000;">pg_fetch_all</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$res</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span> <span style="color: #666666; font-style: italic;">// array com todos os resultados</span>
<span style="color: #000000; font-weight: bold;">?&gt;</span></pre></div></div>

<p>Com esse código, a cada acesso na página, teremos uma consulta de 1 segundo feita ao banco de dados. Muitas vezes, a consulta será exatamente a mesma. Modificando a consulta para uso do memcached, teríamos algo assim:</p>

<div class="wp_syntax"><div class="code"><pre class="php" style="font-family:monospace;"><span style="color: #000000; font-weight: bold;">&lt;?php</span>
<span style="color: #666666; font-style: italic;">// Conecta ao memcached</span>
<span style="color: #000088;">$mc</span> <span style="color: #339933;">=</span> <span style="color: #000000; font-weight: bold;">new</span> Memcache<span style="color: #339933;">;</span>
<span style="color: #000088;">$mc</span><span style="color: #339933;">-&gt;</span><span style="color: #004000;">addServer</span><span style="color: #009900;">&#40;</span><span style="color: #0000ff;">'ip.do.servidor'</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
&nbsp;
<span style="color: #000088;">$sql</span> <span style="color: #339933;">=</span> <span style="color: #0000ff;">&quot;SELECT * FROM tabela INNER JOIN ......&quot;</span><span style="color: #339933;">;</span>
<span style="color: #000088;">$cache</span> <span style="color: #339933;">=</span> <span style="color: #000088;">$mc</span><span style="color: #339933;">-&gt;</span><span style="color: #004000;">get</span><span style="color: #009900;">&#40;</span><span style="color: #990000;">md5</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$sql</span><span style="color: #009900;">&#41;</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span> <span style="color: #666666; font-style: italic;">// Usamos o md5() da query como chave</span>
&nbsp;
<span style="color: #b1b100;">if</span> <span style="color: #009900;">&#40;</span><span style="color: #000088;">$cache</span> <span style="color: #339933;">===</span> <span style="color: #009900; font-weight: bold;">false</span><span style="color: #009900;">&#41;</span> <span style="color: #009900;">&#123;</span>
    <span style="color: #666666; font-style: italic;">// Resultado não está no cache</span>
    <span style="color: #000088;">$res</span> <span style="color: #339933;">=</span> <span style="color: #990000;">pg_query</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$sql</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
    <span style="color: #000088;">$arr</span> <span style="color: #339933;">=</span> <span style="color: #990000;">pg_fetch_all</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$res</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
    <span style="color: #000088;">$mc</span><span style="color: #339933;">-&gt;</span><span style="color: #004000;">set</span><span style="color: #009900;">&#40;</span><span style="color: #990000;">md5</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$sql</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">,</span> <span style="color: #000088;">$arr</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
<span style="color: #009900;">&#125;</span>
<span style="color: #b1b100;">else</span> <span style="color: #009900;">&#123;</span>
    <span style="color: #000088;">$arr</span> <span style="color: #339933;">=</span> <span style="color: #000088;">$cache</span><span style="color: #339933;">;</span>
<span style="color: #009900;">&#125;</span>
<span style="color: #000000; font-weight: bold;">?&gt;</span></pre></div></div>

<p>Pelo exemplo acima, temos algumas modificações. Primeiramente conectamos ao memcached. A chamada a addServer() pode ser feita múltiplas vezes, caso existam vários memcached rodando em máquinas separadas. Pode ser dado um &#8220;peso&#8221; pra cada servidor também, de acordo com a memória disponível em cada um.<br />
Logo em seguida, é feita a verificação no memcached se o resultado da consulta já está lá. Como chave, usei o hash md5 da consulta, pra gerar uma identificação única. O método get() pode retornar false, caso a chave não esteja no memcached, ou retornar o objeto que foi guardado.<br />
A checagem é simples. Se o get() retornou false, então o sistema faz a consulta como já fazia antes, e no fim guarda o resultado no memcached, pra agilizar as próximas consultas. E caso não tenha retornado false, temos já o resultado da consulta diretamente. Ao fim do bloco <i>if</i>, teremos, de uma forma ou de outra, o resultado da consulta em $arr.<br />
A diferença é que rodando a consulta no banco, o tempo será de cerca de 1 segundo (tempo que estimamos para a execução da consulta), e pegando o resultado direto do memcached, a consulta demorará algo da ordem de milissegundos para ser completada.</p>
<h2>Problemas</h2>
<p>Um dos problemas clássicos em qualquer abordagem que use cache é como saber se as informações em cache ainda estão atuais. Com o memcached, isso não é diferente. Existem algumas formas de se lidar com o problema.<br />
A primeira delas, mais simples, e que pode ser usada livremente caso não seja de suma importância que os dados estejam atuais, é mexer no tempo em que a informação ficará no cache. O tempo pode ser especificado na chamada ao método set(), da seguinte forma:</p>

<div class="wp_syntax"><div class="code"><pre class="php" style="font-family:monospace;"><span style="color: #000000; font-weight: bold;">&lt;?php</span>
<span style="color: #000088;">$mc</span><span style="color: #339933;">-&gt;</span><span style="color: #004000;">set</span><span style="color: #009900;">&#40;</span><span style="color: #990000;">md5</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$sql</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">,</span> <span style="color: #000088;">$arr</span><span style="color: #339933;">,</span> MEMCACHE_COMPRESSED<span style="color: #339933;">,</span> <span style="color: #cc66cc;">60</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
<span style="color: #000000; font-weight: bold;">?&gt;</span></pre></div></div>

<p>Temos neste exemplo todos os parâmetros para a chamada de set(): a chave, o objeto a ser guardado, uma flag (pode ser usado MEMCACHE_COMPRESSED, que indica que o objeto será comprimido para ocupar menos espaço, ou 0 pra indicar que deve ser guardado sem compressão), e por último o tempo de vida do objeto, no caso, 60 segundos.<br />
Ou seja, caso não haja problema das informações permanecerem desatualizadas por 60 segundos no máximo, essa abordagem pode ser usada.<br />
Caso a informação tenha que estar sempre atualizada, a forma de tratamento terá que ser outra. O memcached possui método para apagar o objeto associado a uma chave. Tendo a chave, basta usar:</p>

<div class="wp_syntax"><div class="code"><pre class="php" style="font-family:monospace;"><span style="color: #000000; font-weight: bold;">&lt;?php</span>
<span style="color: #000088;">$mc</span><span style="color: #339933;">-&gt;</span><span style="color: #004000;">delete</span><span style="color: #009900;">&#40;</span><span style="color: #0000ff;">'chave'</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
<span style="color: #000000; font-weight: bold;">?&gt;</span></pre></div></div>

<p>e a entrada que existia no memcached para aquela chave será invalidada.<br />
A idéia, nesse segundo caso, é justamente localizar no código todos os pontos que modificam o banco de dados de forma que possa alterar o resultado da consulta feita, e adicionar código para invalidar o cache nesses pontos. Assim, quando for feita a consulta no memcached, caso alguma informação tenha sido modificada, a entrada correspondente no memcached já terá sido apagada, e a chamada a get() retornará false naturalmente.<br />
É claro que essa segunda abordagem dá muito mais trabalho, por isso a sugestão de se usar a primeira delas nos casos em que pode ser usada. Lembre-se que em um site com 100 acessos por segundo, um tempo de vida de 60 segundos evitará 5999 consultas ao banco (a primeira será feita e guardada).</p>
<h2>Mais informações</h2>
<p>O site do projeto tem <a href="http://code.google.com/p/memcached/wiki/Start">um Wiki</a> que responde a maior parte das dúvidas que se pode ter, em relação a instalação e ao uso.<br />
No caso do PHP, as funções são bem documentadas na <a href="http://br.php.net/manual/en/book.memcache.php">parte do manual sobre memcache</a>.<br />
Eu uso em produção o memcached, com 2 servidores, um com 768mb de memória disponíveis para o memcached e outro com 256mb. Dei pesos 3 e 1 respectivamente, para que um objeto tenha 3 vezes mais chance de cair no primeiro servidor. A configuração está bastante satisfatória, e o banco de dados agradece.</p>
<h3  class="related_post_title">Artigos relacionados</h3><ul class="related_post"><li><a href="http://www.ataraxia.com.br/posts/evitando-sql-injection-em-php" title="Evitando SQL injection em PHP">Evitando SQL injection em PHP</a></li><li><a href="http://www.ataraxia.com.br/posts/otimizacao-imagens-inline" title="Otimização: imagens inline">Otimização: imagens inline</a></li><li><a href="http://www.ataraxia.com.br/posts/otimizacao-de-sites-parte-3-cache" title="Otimização de sites, parte 3 &#8211; Cache">Otimização de sites, parte 3 &#8211; Cache</a></li><li><a href="http://www.ataraxia.com.br/posts/otimizacao-de-sites-parte-2-compressao" title="Otimização de sites, parte 2 &#8211; Compressão">Otimização de sites, parte 2 &#8211; Compressão</a></li><li><a href="http://www.ataraxia.com.br/posts/otimizacao-em-php-parte-1-minify" title="Otimização em PHP, parte 1: Minify">Otimização em PHP, parte 1: Minify</a></li><li><a href="http://www.ataraxia.com.br/posts/problemas-com-acentuacao" title="Problemas com acentuação?">Problemas com acentuação?</a></li><li><a href="http://www.ataraxia.com.br/posts/o-limite-de-4-ou-3-gb-de-memoria" title="O limite de 4 (ou 3?) Gb de memória">O limite de 4 (ou 3?) Gb de memória</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ataraxia.com.br/posts/otimizacao-de-sites-com-memcached/feed</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>O limite de 4 (ou 3?) Gb de memória</title>
		<link>http://www.ataraxia.com.br/posts/o-limite-de-4-ou-3-gb-de-memoria</link>
		<comments>http://www.ataraxia.com.br/posts/o-limite-de-4-ou-3-gb-de-memoria#comments</comments>
		<pubDate>Fri, 26 Dec 2008 12:18:10 +0000</pubDate>
		<dc:creator>Bruno Lustosa</dc:creator>
				<category><![CDATA[so]]></category>
		<category><![CDATA[linux]]></category>
		<category><![CDATA[memoria]]></category>
		<category><![CDATA[pae]]></category>
		<category><![CDATA[windows]]></category>

		<guid isPermaLink="false">http://blog.ataraxia.com.br/?p=36</guid>
		<description><![CDATA[Quem tem um computador com 4 Gb ou mais de memória e usa um sistema operacional de 32 bits já deve ter percebido que o computador não consegue enxergar toda a memória, ficando limitado em algo entre 3 e 4 Gb, dependendo do sistema operacional. O problema A razão desse &#8220;problema&#8221; é simples: o sistema [...]]]></description>
			<content:encoded><![CDATA[<p>Quem tem um computador com 4 Gb ou mais de memória e usa um sistema operacional de 32 bits já deve ter percebido que o computador não consegue enxergar toda a memória, ficando limitado em algo entre 3 e 4 Gb, dependendo do sistema operacional.</p>
<h4>O problema</h4>
<p>A razão desse &#8220;problema&#8221; é simples: o sistema operacional é de 32 bits. Se o sistema operacional é de 32 bits, significa que o maior número que ele pode colocar alocar em um <i>registrador</i> (pequena unidade de memória que fica dentro do processador) é um número de 32 bits. Como endereços de memórias são números, o espaço máximo possível de endereçamento tambem tem 32 bits. E fazendo a conta, temos que 2^32 = 4 Gb.</p>
<p>No Windows, o espaço fica limitado em 3 Gb, porque 1 Gb é reservado para o kernel do sistema.<br />
Pronto, já entendemos o porque do problema. Agora, o que fazer para solucioná-lo?</p>
<h4>A solução limpa</h4>
<p>A primeira solução, e a melhor delas, é migrar para um sistema operacional de 64 bits. Além do ganho no espaço de endereçamento, programas em 64 bits fazem uso melhor do processador.</p>
<p>Considero esta solução como limpa por ser algo nativo. Os programas são compilados em modo 64 bits, e naturalmente já possuem este espaço de endereçamento.</p>
<p>Existem versões 64 bits dos sistemas operacionais mais populares: Linux, Windows (XP/Vista).</p>
<p>Porém, existem casos em que a migração não pode ser feita, e aí existe uma &#8220;gambiarra&#8221; que pode ser feita pra se aumentar um pouco o espaço de endereçamento.</p>
<h4>A solução porca</h4>
<p>Praticamente todos os processadores de hoje em dia (Intel do Pentium Pro em diante, e AMD do Athlon em diante) suportam PAE, ou <i>Physical Address Extension</i> (Extensão de endereçamento físico). A idéia é adicionar mais 4 bits no espaço de endereçamento, aumentando para 36 bits, que nos dá: 2^36 = 64 Gb de espaço.</p>
<p>Claro, o PAE depende tambem do sistema operacional. Chamo de gambiarra, porque os programas continuam enxergando no máximo 32 bits (ou seja, os programs continuam limitados a 4 Gb de memória), e quem gerencia o espaço total é o sistema operacional. Cabe a ele decidir quais programas acessam quais espaços de 32 bits. Não é algo nativo.</p>
<p>Além disso, o sistema vai ficar todo um pouco mais lento, devido ao processamento extra que precisa ser feito pelo sistema operacional para gerenciar esses 4 bits extras.</p>
<h4>Windows</h4>
<p>No mundo Windows, o espaço total suportado pelo sistema operacional depende da versão. O XP enxerga no máximo 4 Gb de memória, mesmo com PAE. <a href="http://www.microsoft.com/whdc/system/platform/server/PAE/PAEdrv.mspx#EW">Outras versões variam um pouco</a>.</p>
<p>Para se utilizar a memória extra provida pelo PAE, é preciso abrir o arquivo boot.ini, e adicionar o parâmetro <b>/PAE</b> na linha correspondente.</p>
<p>O lado ruim de usar no Windows é que o espaço total não depende somente do PAE, e sim da versão do Windows utilizada. Ou seja, além da restrição dos 64 Gb, o sistema operacional também impõe restrições extras, de modo que dependendo da versão, o sistema continuará sem conseguir enxergar a memória inteira (vide Windows XP e o limite de 4 Gb).</p>
<h4>Linux</h4>
<p>No Linux, as coisas são um pouco mais tranquilas. Basta habilitar o suporte a PAE no kernel do sistema, e ter todos os módulos também compilados com suporte a PAE. A opção relevante fica na parte &#8220;Processor type and features&#8221;, em &#8220;High Memory Support&#8221;.</p>
<p>Ali se escolhe entre desligado, onde o sistema enxerga no máximo 1 Gb de memória, e é a opção recomendada para computadores com 1 Gb ou menos de memória, por ser mais rápida, 4 Gb ou 64 Gb. A opção desejada é a 64 Gb, para utilizar todos os 36 bits disponibilizados, sem nenhuma restrição adicional, como acontece no Windows.</p>
<h4>Na prática</h4>
<p>Em casa, estou utilizando tanto o Windows XP x64 Edition quanto o Linux (Ubuntu 8.10 &#8211; 64 bits) sem maiores problemas. No Windows, consegui driver pra tudo nos sites dos fabricantes (Abit &#8211; placa mãe, nVidia &#8211; placa de vídeo). No Linux, o Ubuntu cuidou de tudo pra mim, embora possam existir problemas com o driver binário da nVidia (tentei fazer o upgrade para o 9 e não consegui).</p>
<p>No Linux, os únicos programas que tive problema foram os emuladores, que por precisarem de muita velocidade, tem partes que são feitas diretamente em Assembly (pra 32 bits), e por isso nem sempre compilam diretamente em 64 bits. Porém, existe sempre a possibilidade de se executar programas 32 bits, bastando ter as bibliotecas 32 bits que o programa necessita.</p>
<p>No Windows, até agora, não tive problema nenhum.</p>
<h3  class="related_post_title">Artigos relacionados</h3><ul class="related_post"><li><a href="http://www.ataraxia.com.br/posts/personalizando-cflags-por-pacote-no-gentoo" title="Personalizando CFLAGS por pacote no Gentoo">Personalizando CFLAGS por pacote no Gentoo</a></li><li><a href="http://www.ataraxia.com.br/posts/otimizacao-de-sites-com-memcached" title="Otimização de sites com memcached">Otimização de sites com memcached</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ataraxia.com.br/posts/o-limite-de-4-ou-3-gb-de-memoria/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

