

<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Rodrigo Kumpera Weblog</title>
	<atom:link href="http://www.kumpera.net/blog/index.php/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.kumpera.net/blog</link>
	<description>Meus achados sobre tecnologia</description>
	<lastBuildDate>Thu, 14 Jul 2011 15:45:23 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.6</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>A beleza do sistema de tipos do C#</title>
		<link>http://www.kumpera.net/blog/index.php/2011/07/14/a-beleza-do-sistema-de-tipos-do-c/</link>
		<comments>http://www.kumpera.net/blog/index.php/2011/07/14/a-beleza-do-sistema-de-tipos-do-c/#comments</comments>
		<pubDate>Thu, 14 Jul 2011 15:45:23 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[Programming]]></category>
		<category><![CDATA[Programming language Theory]]></category>
		<category><![CDATA[language design]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=171</guid>
		<description><![CDATA[Outro dia me apresentaram o código abaixo com um dúvida bem boba. Esse código em C# abusa um pouco de uma das novidades da última revisão da linguagem, tipos genéricos variantes. Vamos ao código:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
interface A&#60;in B&#62; &#123; &#125;
&#160;
interface B&#60;in A&#62; &#123; &#125;
&#160;
class X : A&#60;B&#60;X&#62;&#62; &#123; &#125;
&#160;
class Y : B&#60;A&#60;Y&#62;&#62; &#123; &#125;
&#160;
class Test
&#123;
	static void Main [...]]]></description>
			<content:encoded><![CDATA[<p>Outro dia me apresentaram o código abaixo com um dúvida bem boba. Esse código em C# abusa um pouco de uma das novidades da última revisão da linguagem, tipos genéricos variantes. Vamos ao código:</p>

<div class="wp_syntax"><table><tr><td class="line_numbers"><pre>1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
</pre></td><td class="code"><pre class="csharp" style="font-family:monospace;"><span style="color: #FF0000;">interface</span> A<span style="color: #008000;">&lt;</span><span style="color: #0600FF;">in</span> B<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span> <span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #FF0000;">interface</span> B<span style="color: #008000;">&lt;</span><span style="color: #0600FF;">in</span> A<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span> <span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #FF0000;">class</span> X <span style="color: #008000;">:</span> A<span style="color: #008000;">&lt;</span>B<span style="color: #008000;">&lt;</span>X<span style="color: #008000;">&gt;&gt;</span> <span style="color: #000000;">&#123;</span> <span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #FF0000;">class</span> Y <span style="color: #008000;">:</span> B<span style="color: #008000;">&lt;</span>A<span style="color: #008000;">&lt;</span>Y<span style="color: #008000;">&gt;&gt;</span> <span style="color: #000000;">&#123;</span> <span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #FF0000;">class</span> Test
<span style="color: #000000;">&#123;</span>
	<span style="color: #0600FF;">static</span> <span style="color: #0600FF;">void</span> Main <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#41;</span>
	<span style="color: #000000;">&#123;</span>
		A<span style="color: #008000;">&lt;</span>Y<span style="color: #008000;">&gt;</span> x <span style="color: #008000;">=</span> <span style="color: #008000;">new</span> X <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
	<span style="color: #000000;">&#125;</span>
<span style="color: #000000;">&#125;</span></pre></td></tr></table></div>

<p>O código é um enrolado. A parte mais importante é entender <strong>interface A&#60;in B&#62;</strong> que é a declaração de A contravariante em B. Isso significa, a grosso modo, que <strong>A&#60;object&#62; instanceof A&#60;string&#62; == true</strong>.</p>
<p>A dúvida é se a atribuição <strong>A&#60;Y&#62; x = new X ();</strong> é válida. Vou usar <em>&#60;:</em> como notação para<br />
pode ser atribuido em, como em <em>string &#60;: object</em>.</p>

<div class="wp_syntax"><div class="code"><pre class="csharp" style="font-family:monospace;">X <span style="color: #008000;">&lt;:</span> A<span style="color: #008000;">&lt;</span>Y<span style="color: #008000;">&gt;</span> <span style="color: #008080; font-style: italic;">//X é uma classe e A uma interface, logo verificamos as interfaces de X</span>
A<span style="color: #008000;">&lt;</span>B<span style="color: #008000;">&lt;</span>X<span style="color: #008000;">&gt;&gt;</span> <span style="color: #008000;">&lt;:</span> A<span style="color: #008000;">&lt;</span>Y<span style="color: #008000;">&gt;</span> <span style="color: #008080; font-style: italic;">//Duas instâncias diferentes do mesmo tipo genérico. Por ser contravariante no primeiro parâmetro, verificamos ele</span>
&nbsp;
<span style="color: #008080; font-style: italic;">//Note que contravariância significa verificar na ordem inversa</span>
Y <span style="color: #008000;">&lt;:</span> B<span style="color: #008000;">&lt;</span>X<span style="color: #008000;">&gt;</span>  <span style="color: #008080; font-style: italic;">//Y é uma classe e B uma interface, logo verificamos as interfaces de Y</span>
B<span style="color: #008000;">&lt;</span>A<span style="color: #008000;">&lt;</span>Y<span style="color: #008000;">&gt;&gt;</span> <span style="color: #008000;">&lt;:</span> B<span style="color: #008000;">&lt;</span>X<span style="color: #008000;">&gt;</span> <span style="color: #008080; font-style: italic;">//Novamente duas instancias de um tipo contravariante, verificamos o primeiro parâmetro</span>
&nbsp;
X <span style="color: #008000;">&lt;:</span> A<span style="color: #008000;">&lt;</span>Y<span style="color: #008000;">&gt;</span></pre></div></div>

<p>Calma la, voltamos a definição original! Sim, voltamos, existe um ciclo nessa verificação e ela não pode ser decidida. Tanto o compilador como o sistema de tipos são não capazes de decidir. A solução pragmática é simplesmente recusar essa atribuição.</p>
<p>Quem imaginaria que o novo sistema de tipos do C# possui casos que não decidíveis. Pois é, e não fica só nisso, existem outros problemas envolvendo variância como ambiguidade no caso de últimas interfaces que merecem outro artigo. </p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2011/07/14/a-beleza-do-sistema-de-tipos-do-c/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Escrevendo um JIT em menos de 40 linhas de C#</title>
		<link>http://www.kumpera.net/blog/index.php/2010/08/30/escrevendo-um-jit-em-menos-de-40-linhas-de-c/</link>
		<comments>http://www.kumpera.net/blog/index.php/2010/08/30/escrevendo-um-jit-em-menos-de-40-linhas-de-c/#comments</comments>
		<pubDate>Mon, 30 Aug 2010 12:00:15 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[Programming]]></category>
		<category><![CDATA[assembly]]></category>
		<category><![CDATA[C]]></category>
		<category><![CDATA[compilers]]></category>
		<category><![CDATA[jit]]></category>
		<category><![CDATA[x86]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=157</guid>
		<description><![CDATA[O desafio é escrever um programa capaz de gerar o código nativo para uma função &#8220;int foo () { return 10; }&#8221; e executá-lo. Parece impossível, mas não é. E com um pouco de esforço não deve consumir muito tempo também. Para isso vamos precisar saber algumas coisas antes.
Primeiro, é necessário saber um pouco de [...]]]></description>
			<content:encoded><![CDATA[<p>O desafio é escrever um programa capaz de gerar o código nativo para uma função &#8220;int foo () { return 10; }&#8221; e executá-lo. Parece impossível, mas não é. E com um pouco de esforço não deve consumir muito tempo também. Para isso vamos precisar saber algumas coisas antes.</p>
<p>Primeiro, é necessário saber um pouco de assembly e entender como funciona a <a href="http://en.wikipedia.org/wiki/X86_calling_conventions">calling convention</a> de um pc 32bit. Feito isso o próximo passo é baixar os manuais da plataforma, sejam os da Intel ou da AMD. Estou acostumado com os da Intel, inclusive tenho eles em árvore morta.</p>
<p>Depois disso, precisamos aprender a usar a ferramenta mais importante para quem quer se aventurar nessa área, o disassembler. No meu caso, usei o objdump da gnu. Instalei via macports no OSX é o gobjdmp por algum motivo.</p>
<p>São dois comandos essenciais que vamos usar, o primeiro é o &#8220;gobjdump -d&#8221; que disassembla um binário padrão da plataforma, vamos usá-lo para roubar o assembly necessário para nossa função a ser compilada. O segundo é &#8220;gobjdump -D -b binary -m i386&#8243; que desassembla um blog binário não estruturado, essa usamos para fazer dump em arquivos do nosso código gerado e verificar seu o conteúdo.</p>
<p>Feito isso, compilamos o código C da nossa função e o assembly dela é algo como:</p>

<div class="wp_syntax"><table><tr><td class="line_numbers"><pre>1
2
3
4
5
6
7
</pre></td><td class="code"><pre class="asm" style="font-family:monospace;">&lt;_foo&gt;<span style="color: #339933;">:</span>
    <span style="color: #00007f; font-weight: bold;">push</span>   <span style="color: #339933;">%</span><span style="color: #00007f;">ebp</span>
    <span style="color: #00007f; font-weight: bold;">mov</span>    <span style="color: #339933;">%</span><span style="color: #00007f;">esp</span><span style="color: #339933;">,%</span><span style="color: #00007f;">ebp</span>
    <span style="color: #00007f; font-weight: bold;">sub</span>    $<span style="color: #0000ff;">0x8</span><span style="color: #339933;">,%</span><span style="color: #00007f;">esp</span>
    <span style="color: #00007f; font-weight: bold;">mov</span>    $<span style="color: #0000ff;">0xa</span><span style="color: #339933;">,%</span><span style="color: #00007f;">eax</span>
    <span style="color: #00007f; font-weight: bold;">leave</span>  
    <span style="color: #00007f; font-weight: bold;">ret</span></pre></td></tr></table></div>

<p>Curto e simples, entender oque cada instrução faz deixo como exercício ao leitor porém. Para gerar essa seqüência em runtime precisamos saber como encodificar cada instrução e um manual da arquitetura é a melhor forma para tal. Por sorte não é necessário saber de nenhuma das formas avançadas de ModRM.</p>
<p>Mas primeiro precisamos alocar um bloco de memória no qual podemos escrever e executar. No caso de sistemas unix usamos a função mmap que permite mapear um bloco anônimo de memória [1] no processo corrente. Com C# no OSX isso é tão trivial quanto o seguinte[2]:</p>

<div class="wp_syntax"><table><tr><td class="line_numbers"><pre>1
2
3
4
5
6
</pre></td><td class="code"><pre class="csharp" style="font-family:monospace;">	<span style="color: #000000;">&#91;</span>DllImport <span style="color: #000000;">&#40;</span><span style="color: #666666;">&quot;libc&quot;</span>, EntryPoint<span style="color: #008000;">=</span><span style="color: #666666;">&quot;mmap&quot;</span><span style="color: #000000;">&#41;</span><span style="color: #000000;">&#93;</span>
	<span style="color: #0600FF;">public</span> <span style="color: #0600FF;">static</span> <span style="color: #0600FF;">extern</span> IntPtr mmap <span style="color: #000000;">&#40;</span>IntPtr addr, IntPtr len, <span style="color: #FF0000;">int</span> prot, <span style="color: #FF0000;">int</span> flags, <span style="color: #FF0000;">uint</span> off_t<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
	<span style="color: #FF0000;">int</span> prot <span style="color: #008000;">=</span> 0x1 <span style="color: #008000;">|</span> 0x2 <span style="color: #008000;">|</span> 0x4<span style="color: #008000;">;</span> <span style="color: #008080; font-style: italic;">//PROT_READ | PROT_WRITE | PROT_EXEC</span>
	<span style="color: #FF0000;">int</span> flag <span style="color: #008000;">=</span> 0x1000 <span style="color: #008000;">|</span> 0x0002<span style="color: #008000;">;</span> <span style="color: #008080; font-style: italic;">//MAP_ANON | MAP_PRIVATE</span>
	var res <span style="color: #008000;">=</span> mmap <span style="color: #000000;">&#40;</span>IntPtr.<span style="color: #0000FF;">Zero</span>, <span style="color: #000000;">&#40;</span>IntPtr<span style="color: #000000;">&#41;</span><span style="color: #FF0000;">4096</span>, prot , flags, <span style="color: #FF0000;">0</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span></pre></td></tr></table></div>

<p>Para escrever nesse bloco de memória recém alocado usamos UnmanagedMemoryStream que é uma bela mão na roda para esses casos. Por fim, para invocarmos o código usamos outra facilidade do framework, o método </i>Marshal.GetDelegateForFunctionPointer</i>. Quando fiz isso em Java a alguns anos esses 3 passos foram muito mais difíceis.</p>
<p>Enfim, chega de enrolação, o código completo para nosso super JIT é o seguinte:</p>

<div class="wp_syntax"><table><tr><td class="line_numbers"><pre>1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
</pre></td><td class="code"><pre class="csharp" style="font-family:monospace;"><span style="color: #0600FF;">using</span> <span style="color: #008080;">System</span><span style="color: #008000;">;</span>
<span style="color: #0600FF;">using</span> <span style="color: #008080;">System.Runtime.CompilerServices</span><span style="color: #008000;">;</span>
<span style="color: #0600FF;">using</span> <span style="color: #008080;">System.Runtime.InteropServices</span><span style="color: #008000;">;</span>
<span style="color: #0600FF;">using</span> <span style="color: #008080;">System.IO</span><span style="color: #008000;">;</span>
&nbsp;
<span style="color: #0600FF;">public</span> <span style="color: #FF0000;">delegate</span> <span style="color: #FF0000;">int</span> NoArgsReturnInt <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
<span style="color: #FF0000;">class</span> Test <span style="color: #000000;">&#123;</span>
	<span style="color: #000000;">&#91;</span>DllImport <span style="color: #000000;">&#40;</span><span style="color: #666666;">&quot;libc&quot;</span>, EntryPoint<span style="color: #008000;">=</span><span style="color: #666666;">&quot;mmap&quot;</span><span style="color: #000000;">&#41;</span><span style="color: #000000;">&#93;</span>
	<span style="color: #0600FF;">public</span> <span style="color: #0600FF;">static</span> <span style="color: #0600FF;">extern</span> IntPtr mmap <span style="color: #000000;">&#40;</span>IntPtr addr, IntPtr len, <span style="color: #FF0000;">int</span> prot, <span style="color: #FF0000;">int</span> flags, <span style="color: #FF0000;">uint</span> off_t<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
	<span style="color: #0600FF;">public</span> <span style="color: #0600FF;">static</span> <span style="color: #0600FF;">unsafe</span> <span style="color: #0600FF;">void</span> Main <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
		<span style="color: #FF0000;">int</span> prot <span style="color: #008000;">=</span> 0x1 <span style="color: #008000;">|</span> 0x2 <span style="color: #008000;">|</span> 0x4<span style="color: #008000;">;</span> <span style="color: #008080; font-style: italic;">//PROT_READ | PROT_WRITE | PROT_EXEC</span>
		<span style="color: #FF0000;">int</span> flag <span style="color: #008000;">=</span> 0x1000 <span style="color: #008000;">|</span> 0x0002<span style="color: #008000;">;</span> <span style="color: #008080; font-style: italic;">//MAP_ANON | MAP_PRIVATE</span>
		var res <span style="color: #008000;">=</span> mmap <span style="color: #000000;">&#40;</span>IntPtr.<span style="color: #0000FF;">Zero</span>, <span style="color: #000000;">&#40;</span>IntPtr<span style="color: #000000;">&#41;</span><span style="color: #FF0000;">4096</span>, prot , flags, <span style="color: #FF0000;">0</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
		var mem <span style="color: #008000;">=</span> <span style="color: #008000;">new</span> UnmanagedMemoryStream <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#40;</span><span style="color: #FF0000;">byte</span><span style="color: #008000;">*</span><span style="color: #000000;">&#41;</span>res, <span style="color: #FF0000;">4096</span>, <span style="color: #FF0000;">4096</span>, FileAccess.<span style="color: #0000FF;">ReadWrite</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
		<span style="color: #008080; font-style: italic;">//push ebp</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0x50 <span style="color: #008000;">+</span> 0x05<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
		<span style="color: #008080; font-style: italic;">//mov esp, ebp</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0x89<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0xE5<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
		<span style="color: #008080; font-style: italic;">//mov 10, eax</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0xB8 <span style="color: #008000;">+</span> 0x00<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0x0A<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0x00<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0x00<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0x00<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
		<span style="color: #008080; font-style: italic;">//leave</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0xC9<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
		<span style="color: #008080; font-style: italic;">//ret</span>
		mem.<span style="color: #0000FF;">WriteByte</span> <span style="color: #000000;">&#40;</span>0xC3<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
		NoArgsReturnInt dele <span style="color: #008000;">=</span> <span style="color: #000000;">&#40;</span>NoArgsReturnInt<span style="color: #000000;">&#41;</span>Marshal.<span style="color: #0000FF;">GetDelegateForFunctionPointer</span> <span style="color: #000000;">&#40;</span>res, <span style="color: #008000;">typeof</span> <span style="color: #000000;">&#40;</span>NoArgsReturnInt<span style="color: #000000;">&#41;</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
		Console.<span style="color: #0000FF;">WriteLine</span> <span style="color: #000000;">&#40;</span>dele <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#41;</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
	<span style="color: #000000;">&#125;</span>
<span style="color: #000000;">&#125;</span></pre></td></tr></table></div>

<p>Incrivelmente simples e curto. Tudo bem que não dá nem para chamar de um brinquedo, porém seu propósito é explorar os princípios básicos por traz de um JIT compiler. Um próximo passo para ele seria gerar 1 função que recebe 2 ints e os soma. Ou tornar o código<br />
menos tosco e mais OO.</p>
<p>[1] mmap permite que bloco de memória seja mapeado para um arquivo<br />
[2] Os valores de prot e flag são específicos ao OSX, então talvez não funcionem em outros derivados unix. Esses valores costumam ficar em /usr/include/sys/mman.h</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2010/08/30/escrevendo-um-jit-em-menos-de-40-linhas-de-c/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Implementando Haskell em VMs tradicionais (parte 2)</title>
		<link>http://www.kumpera.net/blog/index.php/2010/01/09/implementando-haskell-em-vms-tradicionais-parte-2/</link>
		<comments>http://www.kumpera.net/blog/index.php/2010/01/09/implementando-haskell-em-vms-tradicionais-parte-2/#comments</comments>
		<pubDate>Sat, 09 Jan 2010 23:30:36 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[Performance]]></category>
		<category><![CDATA[Programming language Theory]]></category>
		<category><![CDATA[language design]]></category>
		<category><![CDATA[mono]]></category>
		<category><![CDATA[haskell]]></category>
		<category><![CDATA[VM]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=149</guid>
		<description><![CDATA[Retomando a questão sobre como implementar Haskell em VMs tradicionais, vamos ver um dos aspectos mais complicados, thunking, de implementar de forma eficiente. Um dos aspectos que surpreende a maioria dos que usam Haskell pela primeira vez é o fato da linguagem ser lazy evaluated, isto é, o valor de uma expressão só é computado [...]]]></description>
			<content:encoded><![CDATA[<p>Retomando a questão sobre <a href="http://www.kumpera.net/blog/index.php/2009/09/10/implementando-haskell-em-vms-tradicionais-parte-1/">como implementar Haskell em VMs tradicionais</a>, vamos ver um dos aspectos mais complicados, thunking, de implementar de forma eficiente. Um dos aspectos que surpreende a maioria dos que usam Haskell pela primeira vez é o fato da linguagem ser lazy evaluated, isto é, o valor de uma expressão só é computado quando for usado, mesmo entre chamadas funções. Vejamos um exemplo simples:</p>

<div class="wp_syntax"><div class="code"><pre class="haskell" style="font-family:monospace;">square a <span style="color: #339933; font-weight: bold;">=</span> a <span style="color: #339933; font-weight: bold;">*</span> a
&nbsp;
square<span style="color: #339933; font-weight: bold;">_</span>of<span style="color: #339933; font-weight: bold;">_</span>sum a b <span style="color: #339933; font-weight: bold;">=</span> square <span style="color: green;">&#40;</span>a <span style="color: #339933; font-weight: bold;">+</span> b<span style="color: green;">&#41;</span></pre></div></div>

<p>Nesse exemplo, quando square_of_sum chama square, o parâmetro passado não é o resultado de a + b, mas sim algo próximo a uma closure que irá calcular a + b. Quando square for avaliada, ela precisará do valor de &#8216;a&#8217;, então usará a closure que recebeu como parâmetro para tal. Ou melhor, funciona quase assim, Haskell implementa um mecanismo chamado call-by-need, que resolve o valor uma única vez na primeira vez que for necessário memorizando o resultado. Isso significa que no caso de square &#8216;a&#8217; será avaliada uma única vez. Por conta da memorização, não usamos o termo closure, mais sim thunk para descrever o que uma função passa para outra.</p>
<p>Outro detalhe importante, chamadas de função também são lazy evaluated, então tanto square, quanto square_of_sum na verdade retornam thunks para os valores em questão. Essa coisa toda pode parecer extremamente ineficiente a primeira vista e de fato é. Tanto que o GHC gera código sem uso de thunk sempre que conseguir provar que um pedaço de código pode ser strict evaluated [1].</p>
<p>Antes de imaginar como implementar isso em uma VM como a CLR, vamos traduzir nosso exemplo para C# [2]:</p>

<div class="wp_syntax"><div class="code"><pre class="csharp" style="font-family:monospace;">&nbsp;
<span style="color: #FF0000;">class</span> Thunk<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span>
	T value<span style="color: #008000;">;</span>
	Func<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> closure<span style="color: #008000;">;</span>
	<span style="color: #FF0000;">bool</span> resolved<span style="color: #008000;">;</span>
&nbsp;
	<span style="color: #0600FF;">public</span> Thunk <span style="color: #000000;">&#40;</span>Func<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> closure<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
		<span style="color: #0600FF;">this</span>.<span style="color: #0000FF;">closure</span> <span style="color: #008000;">=</span> closure<span style="color: #008000;">;</span>
	<span style="color: #000000;">&#125;</span>
&nbsp;
	<span style="color: #0600FF;">public</span> T Value <span style="color: #000000;">&#123;</span>
		get <span style="color: #000000;">&#123;</span>
			<span style="color: #0600FF;">if</span> <span style="color: #000000;">&#40;</span><span style="color: #008000;">!</span>resolved<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
				value <span style="color: #008000;">=</span> closure <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
				resolved <span style="color: #008000;">=</span> true<span style="color: #008000;">;</span>
				closure <span style="color: #008000;">=</span> null<span style="color: #008000;">;</span>
			<span style="color: #000000;">&#125;</span>
			<span style="color: #0600FF;">return</span> value<span style="color: #008000;">;</span>
		<span style="color: #000000;">&#125;</span>
	<span style="color: #000000;">&#125;</span>
<span style="color: #000000;">&#125;</span>
&nbsp;
Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> square <span style="color: #000000;">&#40;</span>Thunk <span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> a<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
	<span style="color: #0600FF;">return</span> <span style="color: #008000;">new</span> Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#40;</span><span style="color: #000000;">&#41;</span> <span style="color: #008000;">=&gt;</span> a.<span style="color: #0000FF;">Value</span> <span style="color: #008000;">*</span> a.<span style="color: #0000FF;">Value</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
<span style="color: #000000;">&#125;</span>
&nbsp;
Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> square_of_sum <span style="color: #000000;">&#40;</span>Thunk <span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> a, Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> b<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
	Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> a_plus_b <span style="color: #008000;">=</span> <span style="color: #008000;">new</span> Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#40;</span><span style="color: #000000;">&#41;</span> <span style="color: #008000;">=&gt;</span> a.<span style="color: #0000FF;">Value</span> <span style="color: #008000;">+</span> b.<span style="color: #0000FF;">Value</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
	<span style="color: #0600FF;">return</span> square <span style="color: #000000;">&#40;</span>a_plus_b<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span> <span style="color: #008080; font-style: italic;">//Já que square produz um thunk, não precisamos criar outro.</span>
<span style="color: #000000;">&#125;</span></pre></div></div>

<p>Bem confuso, de certo. Primeiro a implementação de Thunk, simples e direta, já square_of_sum precisa de uma variável local para ficar minimamente legível. Uma coisa é fato, C# não foi feita para ser usada com lazy evaluation.</p>
<p>Existe alguns problema quanto a eficiencia de fazer dessa forma. O maior deles é como lidar quando alguns valores já estão resolvidos e temos ainda assim criar um thunk para satisfazer o função chamada. A forma como GHC lida isso é passando todos parâmetros boxed de forma que é possível misturar thunks e valores sem problema. A função square, do nosso exemplo anterior ficaria assim:</p>

<div class="wp_syntax"><div class="code"><pre class="csharp" style="font-family:monospace;">&nbsp;
Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> square <span style="color: #000000;">&#40;</span><span style="color: #FF0000;">object</span> a<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
	<span style="color: #0600FF;">return</span> <span style="color: #008000;">new</span> Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#40;</span><span style="color: #000000;">&#41;</span> <span style="color: #008000;">=&gt;</span> <span style="color: #000000;">&#123;</span>
		<span style="color: #FF0000;">int</span> val<span style="color: #008000;">;</span>
		<span style="color: #0600FF;">if</span> <span style="color: #000000;">&#40;</span>a <span style="color: #008000;">is</span> <span style="color: #FF0000;">int</span><span style="color: #000000;">&#41;</span>
			val <span style="color: #008000;">=</span> <span style="color: #000000;">&#40;</span><span style="color: #FF0000;">int</span><span style="color: #000000;">&#41;</span>a<span style="color: #008000;">;</span>
		<span style="color: #0600FF;">else</span>
			val <span style="color: #008000;">=</span> <span style="color: #000000;">&#40;</span><span style="color: #000000;">&#40;</span>Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span><span style="color: #000000;">&#41;</span>a<span style="color: #000000;">&#41;</span>.<span style="color: #0000FF;">Value</span><span style="color: #008000;">;</span>
		<span style="color: #0600FF;">return</span> val <span style="color: #008000;">*</span> val<span style="color: #008000;">;</span>
	<span style="color: #000000;">&#125;</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
<span style="color: #000000;">&#125;</span></pre></div></div>

<p>Outra forma de também lidar com esse problema é criar duas versões da mesma função, uma que recebe valores resolvidos e outra apenas thunks. Fazer dessa forma é vantagem quando podemos provar o uso estrito dos valores em questão. Por fim, acho que o maior problema ser achar uma forma de representar um thunk usando o mínimo possível de memória.</p>
<p>No nosso exemplo, em uma plataforma 32bits, Trunk<T> usa 20 bytes, Func<T> usa mais 40 e outros 8 da closure[3]. Ou seja, começa usando 68, coisa pacas. Podemos fazer algumas mudanças nisso. Dado que não existe null em Haskell podemos remover o atributo resolved e simplesmente verificar se closure é ou não null. Segundo, em vez criar 1 delegate toda vez podemos fazer caching dele e armazenar as variáveis capturadas no próprio thunk. Algo como:</p>

<div class="wp_syntax"><div class="code"><pre class="csharp" style="font-family:monospace;">abstract <span style="color: #FF0000;">class</span> Thunk<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span>
	<span style="color: #0600FF;">public</span> abstract T Value <span style="color: #000000;">&#123;</span> get<span style="color: #008000;">;</span> <span style="color: #000000;">&#125;</span>
<span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #FF0000;">class</span> ThunkWithVars<span style="color: #008000;">&lt;</span>T,V<span style="color: #008000;">&gt;</span> <span style="color: #008000;">:</span> Thunk<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span>
	T value<span style="color: #008000;">;</span>
	Func<span style="color: #008000;">&lt;</span>V, T<span style="color: #008000;">&gt;</span> closure<span style="color: #008000;">;</span>
	V vars<span style="color: #008000;">;</span>
&nbsp;
	<span style="color: #0600FF;">public</span> ThunkWithVars <span style="color: #000000;">&#40;</span>Func<span style="color: #008000;">&lt;</span>V,T<span style="color: #008000;">&gt;</span> closure, V vars<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
		<span style="color: #0600FF;">this</span>.<span style="color: #0000FF;">closure</span> <span style="color: #008000;">=</span> closure<span style="color: #008000;">;</span>
		<span style="color: #0600FF;">this</span>.<span style="color: #0000FF;">vars</span> <span style="color: #008000;">=</span> vars<span style="color: #008000;">;</span>
	<span style="color: #000000;">&#125;</span>
&nbsp;
	<span style="color: #0600FF;">public</span> <span style="color: #0600FF;">override</span> T Value <span style="color: #000000;">&#123;</span>
		get <span style="color: #000000;">&#123;</span>
			<span style="color: #0600FF;">if</span> <span style="color: #000000;">&#40;</span>closure <span style="color: #008000;">!=</span> <span style="color: #0600FF;">null</span><span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
				value <span style="color: #008000;">=</span> closure <span style="color: #000000;">&#40;</span>vars<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
				closure <span style="color: #008000;">=</span> null<span style="color: #008000;">;</span>
				vars <span style="color: #008000;">=</span> <span style="color: #0600FF;">default</span> <span style="color: #000000;">&#40;</span>V<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
			<span style="color: #000000;">&#125;</span>
			<span style="color: #0600FF;">return</span> value<span style="color: #008000;">;</span>
		<span style="color: #000000;">&#125;</span>
	<span style="color: #000000;">&#125;</span>
<span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #0600FF;">static</span> Func<span style="color: #008000;">&lt;</span>Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span>, <span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> square_resolve <span style="color: #008000;">=</span> <span style="color: #000000;">&#40;</span>a<span style="color: #000000;">&#41;</span> <span style="color: #008000;">=&gt;</span> a.<span style="color: #0000FF;">Value</span> <span style="color: #008000;">*</span> a.<span style="color: #0000FF;">Value</span><span style="color: #008000;">;</span>
&nbsp;
Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> square <span style="color: #000000;">&#40;</span>Thunk <span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> a<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
	<span style="color: #0600FF;">return</span> <span style="color: #008000;">new</span> ThunkWithVars<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span>, Thunk<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;&gt;</span> <span style="color: #000000;">&#40;</span>square_resolve, a<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
<span style="color: #000000;">&#125;</span></pre></div></div>

<p>Usando essa codificação Thunk continua usando 20 bytes porém nos livramos dos demais objetos, um ganho de 70% no final das contas. Poderíamos economizar outros 4 se juntarmos as variáveis closure e value em uma só caso T fosse do tipo referência &#8211; ou manter o resultado boxed. Mesmo sem isso, 20 bytes já é um valor razoável, conseguir o mesmo em uma JVM é basicamente impossível sem muita ginástica.</p>
<p>Qual a performance dessa solução? Segundo o pessoal do GHC, em média 95%-98% dos thunks gerados são resolvidos. Com um generational GC, a maioria vira lixo efêmero. Ou seja, não existe muita razão para uma VM tradicional ser mais lenta que a do GHC, o principal fator nesse caso é, sem dúvida, o compilador, que pode gerar pedaços de código inteiros sem uso de thunk.</p>
<p>[1] É muito comum em Haskell gerar código que não funciona sem lazy evaluation, como geradores de listas infinitas.<br />
[2] Nesse exemplo vou trapacear e tornar as funções mono-mórficas e usar int no lugar de Number para simplificar o código.<br />
[3] Nesse caso estou ignorando quanto de memória as variáveis capturadas usam.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2010/01/09/implementando-haskell-em-vms-tradicionais-parte-2/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Implementando Haskell em VMs tradicionais (parte 1)</title>
		<link>http://www.kumpera.net/blog/index.php/2009/09/10/implementando-haskell-em-vms-tradicionais-parte-1/</link>
		<comments>http://www.kumpera.net/blog/index.php/2009/09/10/implementando-haskell-em-vms-tradicionais-parte-1/#comments</comments>
		<pubDate>Fri, 11 Sep 2009 00:49:24 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[java]]></category>
		<category><![CDATA[language design]]></category>
		<category><![CDATA[mono]]></category>
		<category><![CDATA[C]]></category>
		<category><![CDATA[clr]]></category>
		<category><![CDATA[haskell]]></category>
		<category><![CDATA[jvm]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=138</guid>
		<description><![CDATA[Outro dia uma discussão me levou a pensar se era possível implementar Haskell em cima de uma VM tradicional, tal qual JVM ou CLR, de forma eficiente. Em termos dos mecanismos que a VM precisa suportar de forma eficiente os principais são tail call, thunking, type classes e algebraic types. Nesse artigo vou apenas discutir [...]]]></description>
			<content:encoded><![CDATA[<p>Outro dia uma discussão me levou a pensar se era possível implementar Haskell em cima de uma VM tradicional, tal qual JVM ou CLR, de forma eficiente. Em termos dos mecanismos que a VM precisa suportar de forma eficiente os principais são tail call, thunking, type classes e algebraic types. Nesse artigo vou apenas discutir um deles, type classes.</p>
<p>Uma type class para os acostumados com OO pode ser vista como uma interface cuja implementações são externas aos tipos que estão atrelados. Um exemplo bem simples é Eq, que permite compar objetos do mesmo tipo:</p>

<div class="wp_syntax"><div class="code"><pre class="haskell" style="font-family:monospace;"><span style="color: #06c; font-weight: bold;">class</span> <span style="color: #cccc00; font-weight: bold;">Eq</span> a <span style="color: #06c; font-weight: bold;">where</span>
    <span style="color: green;">&#40;</span><span style="color: #339933; font-weight: bold;">==</span><span style="color: green;">&#41;</span><span style="color: #339933; font-weight: bold;">,</span> <span style="color: green;">&#40;</span><span style="color: #339933; font-weight: bold;">/=</span><span style="color: green;">&#41;</span> <span style="color: #339933; font-weight: bold;">::</span> a <span style="color: #339933; font-weight: bold;">-&gt;</span> a <span style="color: #339933; font-weight: bold;">-&gt;</span> <span style="color: #cccc00; font-weight: bold;">Bool</span>
    x <span style="color: #339933; font-weight: bold;">/=</span> y <span style="color: #339933; font-weight: bold;">=</span> <span style="font-weight: bold;">not</span> <span style="color: green;">&#40;</span>x <span style="color: #339933; font-weight: bold;">==</span> y<span style="color: green;">&#41;</span>
    x <span style="color: #339933; font-weight: bold;">==</span> y <span style="color: #339933; font-weight: bold;">=</span> <span style="font-weight: bold;">not</span> <span style="color: green;">&#40;</span>x <span style="color: #339933; font-weight: bold;">/=</span> y<span style="color: green;">&#41;</span></pre></div></div>

<p>Para nos não iniciado em Haskell, linha um define a classe Eq e diz que ela possui um parâmetro polimófico; linha 2 diz que Eq tem 2 funções, &#8220;==&#8221; e &#8220;/=&#8221; cuja assinatura são dois valores do tipo &#8216;a&#8217; e retorna um booleano; por fim, linhas 3 e 4 são implementações padrão das funções. Seria o equivalente, em pseudo-C#, ao seguinte:</p>

<div class="wp_syntax"><div class="code"><pre class="csharp" style="font-family:monospace;"><span style="color: #FF0000;">interface</span> Eq<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span>
   <span style="color: #FF0000;">bool</span> <span style="color: #0600FF;">operator</span><span style="color: #008000;">==</span> <span style="color: #000000;">&#40;</span>T a, T b<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span> <span style="color: #0600FF;">return</span> <span style="color: #008000;">!</span><span style="color: #000000;">&#40;</span>a <span style="color: #008000;">!=</span> b<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span> <span style="color: #000000;">&#125;</span>
   <span style="color: #FF0000;">bool</span> <span style="color: #0600FF;">operator</span><span style="color: #008000;">!=</span> <span style="color: #000000;">&#40;</span>T a, T b<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span> <span style="color: #0600FF;">return</span> <span style="color: #008000;">!</span><span style="color: #000000;">&#40;</span>a <span style="color: #008000;">==</span> b<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span> <span style="color: #000000;">&#125;</span>
<span style="color: #000000;">&#125;</span></pre></div></div>

<p>Uma das vantagens de type classes no Haskell é que elas podem fornecer implementações padrão para alguns de seus métodos. Bom, agora que temos Eq definida, para dizer que Listas a implementa usamos algo como:</p>

<div class="wp_syntax"><div class="code"><pre class="haskell" style="font-family:monospace;"><span style="color: #06c; font-weight: bold;">instance</span> <span style="color: #cccc00; font-weight: bold;">Eq</span> a <span style="color: #339933; font-weight: bold;">=&gt;</span> <span style="color: #cccc00; font-weight: bold;">Eq</span> <span style="color: green;">&#91;</span>a<span style="color: green;">&#93;</span> <span style="color: #06c; font-weight: bold;">where</span>
    <span style="color: green;">&#91;</span><span style="color: green;">&#93;</span> <span style="color: #339933; font-weight: bold;">==</span> <span style="color: green;">&#91;</span><span style="color: green;">&#93;</span> <span style="color: #339933; font-weight: bold;">=</span> True
    <span style="color: green;">&#40;</span>x:xs<span style="color: green;">&#41;</span> <span style="color: #339933; font-weight: bold;">==</span> <span style="color: green;">&#40;</span>y:ys<span style="color: green;">&#41;</span> <span style="color: #339933; font-weight: bold;">=</span> x<span style="color: #339933; font-weight: bold;">==</span>y <span style="color: #339933; font-weight: bold;">&amp;&amp;</span> xs<span style="color: #339933; font-weight: bold;">==</span>ys
    <span style="color: #339933; font-weight: bold;">_</span> <span style="color: #339933; font-weight: bold;">==</span> <span style="color: #339933; font-weight: bold;">_</span> <span style="color: #339933; font-weight: bold;">=</span> False</pre></div></div>

<p>Aqui vemos uma das melhores características do Haskell é explorada, que é pattern matching &#8211; e isso também é assunto para outro artigo. Como pode se notar, uma implementação de uma dada type class não está embutida na definição do tipo em questão, ou seja, não podemos interfaces como a CLR ou a JVM suportam.</p>
<p>A idéia é representar type classes de forma semelhante a como o ghc faz, usando dictionary passing[1], que é bem simples de entender e implementar. Para cada type class que uma função recebe nos seus parâmetros, passamos junto um objeto que representa as operações em questão. Em C# teríamos:</p>

<div class="wp_syntax"><div class="code"><pre class="csharp" style="font-family:monospace;"><span style="color: #FF0000;">interface</span> Eq<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span>
    <span style="color: #FF0000;">bool</span> op_eq <span style="color: #000000;">&#40;</span>T a, T b<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
    <span style="color: #FF0000;">bool</span> op_neq <span style="color: #000000;">&#40;</span>T a, T b<span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
<span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #FF0000;">class</span> Eq_Int <span style="color: #008000;">:</span> Eq<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span>
    <span style="color: #0600FF;">public</span> <span style="color: #FF0000;">bool</span> op_eq <span style="color: #000000;">&#40;</span><span style="color: #FF0000;">int</span> a, <span style="color: #FF0000;">int</span> b<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span> <span style="color: #0600FF;">return</span> a <span style="color: #008000;">==</span> b<span style="color: #008000;">;</span> <span style="color: #000000;">&#125;</span>
    <span style="color: #0600FF;">public</span> <span style="color: #FF0000;">bool</span> op_eq <span style="color: #000000;">&#40;</span><span style="color: #FF0000;">int</span> a, <span style="color: #FF0000;">int</span> b<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span> <span style="color: #0600FF;">return</span> a <span style="color: #008000;">!=</span> b<span style="color: #008000;">;</span> <span style="color: #000000;">&#125;</span>
<span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #FF0000;">int</span> Fun<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#40;</span>Eq<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> dict, T a, T b<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span>
    <span style="color: #0600FF;">if</span> <span style="color: #000000;">&#40;</span>dict.<span style="color: #0000FF;">op_eq</span> <span style="color: #000000;">&#40;</span>a, b<span style="color: #000000;">&#41;</span><span style="color: #000000;">&#41;</span>
        <span style="color: #0600FF;">return</span> <span style="color: #FF0000;">1</span><span style="color: #008000;">;</span>
    <span style="color: #0600FF;">return</span> <span style="color: #FF0000;">0</span><span style="color: #008000;">;</span>
<span style="color: #000000;">&#125;</span></pre></div></div>

<p>Existe alguns problemas aqui, primeiro que estamos passando um parâmetro extra e segundo que não é possível eliminar a verificar por null pointer caso op_eq seja inlined. A solução é razoavelmente simples no caso do C#:</p>

<div class="wp_syntax"><div class="code"><pre class="csharp" style="font-family:monospace;"><span style="color: #FF0000;">struct</span> Eq_Int <span style="color: #008000;">:</span> Eq<span style="color: #008000;">&lt;</span><span style="color: #FF0000;">int</span><span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span>
    <span style="color: #0600FF;">public</span> <span style="color: #FF0000;">bool</span> op_eq <span style="color: #000000;">&#40;</span><span style="color: #FF0000;">int</span> a, <span style="color: #FF0000;">int</span> b<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span> <span style="color: #0600FF;">return</span> a <span style="color: #008000;">==</span> b<span style="color: #008000;">;</span> <span style="color: #000000;">&#125;</span>
    <span style="color: #0600FF;">public</span> <span style="color: #FF0000;">bool</span> op_neq <span style="color: #000000;">&#40;</span><span style="color: #FF0000;">int</span> a, <span style="color: #FF0000;">int</span> b<span style="color: #000000;">&#41;</span> <span style="color: #000000;">&#123;</span> <span style="color: #0600FF;">return</span> a <span style="color: #008000;">!=</span> b<span style="color: #008000;">;</span> <span style="color: #000000;">&#125;</span>
<span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #FF0000;">int</span> Fun<span style="color: #008000;">&lt;</span>T, TD<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#40;</span>T a, T b<span style="color: #000000;">&#41;</span> where TD<span style="color: #008000;">:</span> Eq<span style="color: #008000;">&lt;</span>T<span style="color: #008000;">&gt;</span> <span style="color: #000000;">&#123;</span>
    <span style="color: #0600FF;">if</span> <span style="color: #000000;">&#40;</span><span style="color: #0600FF;">default</span> <span style="color: #000000;">&#40;</span>TD<span style="color: #000000;">&#41;</span>.<span style="color: #0000FF;">op_eq</span> <span style="color: #000000;">&#40;</span>a, b<span style="color: #000000;">&#41;</span><span style="color: #000000;">&#41;</span>
        <span style="color: #0600FF;">return</span> <span style="color: #FF0000;">1</span><span style="color: #008000;">;</span>
    <span style="color: #0600FF;">return</span> <span style="color: #FF0000;">0</span><span style="color: #008000;">;</span>
<span style="color: #000000;">&#125;</span></pre></div></div>

<p>A grande mudança aqui é tornar a instância da typeclass um valuetype e construir um valor default para satisfazer o compilador. É uma pena que não podemos simplesmente chamar um método estático e TD, o que é uma limitação boba da CLR. Essa solução não é possível na JVM devido a inexistência de valuetypes e generics.</p>
<p>E quanto a performance dessa solução? Bom, no caso do mono, o JIT&#8217;er reconhece as chamadas como não virtuais e é capaz de fazer inline de forma bem agressiva &#8211; exatamente como desejado. Eu pensei em fazer um comparativo dessa solução com o equivalente em Java, mostrando como a CLR permite codificar tipos muito mais ricos e interessantes que a JVM &#8211; e como isso se traduz em performance. Mas realmente não estou afim de criar motivo para um flamewar por parte dos javeiros de plantão.</p>
<p>[1]Esse é o paper original que descreve type classes e a técnica utilizada: http://homepages.inf.ed.ac.uk/wadler/papers/class/class.ps.gz</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2009/09/10/implementando-haskell-em-vms-tradicionais-parte-1/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Limites da orientação a objetos</title>
		<link>http://www.kumpera.net/blog/index.php/2009/08/30/limites-da-orientacao-a-objetos/</link>
		<comments>http://www.kumpera.net/blog/index.php/2009/08/30/limites-da-orientacao-a-objetos/#comments</comments>
		<pubDate>Sun, 30 Aug 2009 20:00:06 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[Programming]]></category>
		<category><![CDATA[Programming language Theory]]></category>
		<category><![CDATA[language design]]></category>
		<category><![CDATA[haskell]]></category>
		<category><![CDATA[plt]]></category>
		<category><![CDATA[ruby]]></category>
		<category><![CDATA[type systems]]></category>
		<category><![CDATA[typeclasses]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=136</guid>
		<description><![CDATA[Toda linguagem de programação pode ser analisada pela sua junção de três elementos distintos: forma, comportamento e taxonomia. Cada um define um aspectodistinto de como o conjunto de valores que compõe um programa é usado.
Cada um destes valores possui um forma, que é a representação concreta para o conceito abstrato que cada um significa. Um [...]]]></description>
			<content:encoded><![CDATA[<p>Toda linguagem de programação pode ser analisada pela sua junção de três elementos distintos: forma, comportamento e taxonomia. Cada um define um aspectodistinto de como o conjunto de valores que compõe um programa é usado.</p>
<p>Cada um destes valores possui um forma, que é a representação concreta para o conceito abstrato que cada um significa. Um array de bytes e uma lista de chars são duas maneiras de representar uma string &#8211; um conceito abstrato. Forma admite composição e extensão, mas isso é razoavelmente óbvio.</p>
<p>Por comportamento me refiro a um grupo que operações definido que operam em um dado conjunto de valores. Repetindo nosso exemplo, strings, podemos definir particionamento, remover espaços em branco e pois ai vai. Ou seja, nada mais simples que um conjunto de funções.</p>
<p>Por fim, taxonomia é como damos nomes a conjuntos de valores. Ruby, que usa um sistema nominal de tipos, damos um nome explicitamente a um dado conjunto de valores que irão habitar uma classe. Outro aspecto importante é que podemos usar os operadores da teoria de conjuntos para definir relações entre pares. Voltando a Ruby, a única relação é a de subconjunto, que é a herança entre duas classes.</p>
<p>São três elementos bem distintos, porém, linguagens OO misturam dois, as vezes mesmo todos. Por exemplo, classes são os três ao mesmo tempo, atributos a forma, métodos o comportamento e a taxonomia vem através da relação herança entre duas classes. Interfaces misturam comportamento e taxonomia. Mixins misturam forma e comportamento. O problema disso é quando você quer manipular apenas um e os outros vem de brinde.</p>
<p>Linguagens funcionais costumam lidar de forma mais efetiva com esse problema. Haskell separa muito bem isso, com datatypes para forma, funções lidam com o comportamento e typeclasses resolvem a questão da taxonomia. Dessa forma é possível focar apenas em um dos três sem nenhuma bagagem extra.</p>
<p>Um problema com haskell é que uma typeclass classifica todos habitantes de um dado tipo, não é possível fazer isso com uma parte apenas. Nesse sentido Qi possui um sistema de tipos muito interessante, baseado em sequent calculus, permitindo definir de forma mais precisa quais valores compõe um dado tipo.</p>
<p>Eu acredito que essa limitação da orientação a objetos é a razão pelo qual tantas pessoas preferem fugir para linguagens OO dinâmicas, que aliviam boa parte do problema dado que forma e taxonomia poder ser consideradas ad-hoc, agrada a vários, mas realmente não me agrada para construir sistema de grande escala.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2009/08/30/limites-da-orientacao-a-objetos/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Onde estão os profissionais?</title>
		<link>http://www.kumpera.net/blog/index.php/2009/05/15/onde-estao-os-profissionais/</link>
		<comments>http://www.kumpera.net/blog/index.php/2009/05/15/onde-estao-os-profissionais/#comments</comments>
		<pubDate>Fri, 15 May 2009 12:34:56 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[Programming]]></category>
		<category><![CDATA[misc]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=133</guid>
		<description><![CDATA[Todo mundo fala que existe um deficit de profissionais de tecnologia enorme. Aquele mítico número de cem mil profissionais que ninguém consegue achar. Que isso é um fato, não ha de se discutir, todas empresas com que tenho contato próximo possuem varias vagas em aberto a muitos meses.
A primeira solução que vem à cabeça de [...]]]></description>
			<content:encoded><![CDATA[<p>Todo mundo fala que existe um deficit de profissionais de tecnologia enorme. Aquele mítico número de cem mil profissionais que ninguém consegue achar. Que isso é um fato, não ha de se discutir, todas empresas com que tenho contato próximo possuem varias vagas em aberto a muitos meses.</p>
<p>A primeira solução que vem à cabeça de todos são as faculdades, afinal, uma boa graduação em ciências da computação é uma sólida fundação para um profissional da área. Devem faltar vagas ou coisa parecida, não?</p>
<p>Não, os números da educação superior em computação podem ser entendidos por sórdidos ou desastrosos &#8211; ao gosto do leitor. Segundo <a href="http://www.ibm.com/developerworks/blogs/page/academicbr?entry=produzo_software_no_brasil_na">esse artigo</a> são ofertadas todos os anos 150 mil vagas pelas faculdades. Porém apenas noventa mil se inscrevem nos processos seletivos e, pasmem, apenas 44mil se matriculam de fato em algum curso.</p>
<p>Não satisfeito com tal injúria, informo que apenas 17 mil destes se formam todos os anos. Assustador, no mínimo. Porém sejamos realistas, de seus colegas graduados quantos realmente ingressam na área? No meu caso, digo que esse número é próximo da metade.</p>
<p>Por essa análise, a cada ano o pais oferece 150mil vagas que resultarão em 8.500 novos profissionais ou, em termos relativos, uma taxa de aproveitamento de 5.6%. Pífio, péssimo, patético. Agora de quem é a culpa disso? Provavelmente minha, e sua, de todos nós. Está mais que na hora de fazermos algo pelos alumni de tecnologia deste pais.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2009/05/15/onde-estao-os-profissionais/feed/</wfw:commentRss>
		<slash:comments>17</slash:comments>
		</item>
		<item>
		<title>Lançado Mono 2.2 com estréia de Mono.Simd</title>
		<link>http://www.kumpera.net/blog/index.php/2009/01/14/lancado-mono-22-com-estreia-de-monosimd/</link>
		<comments>http://www.kumpera.net/blog/index.php/2009/01/14/lancado-mono-22-com-estreia-de-monosimd/#comments</comments>
		<pubDate>Thu, 15 Jan 2009 01:36:43 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[Performance]]></category>
		<category><![CDATA[Programming]]></category>
		<category><![CDATA[mono]]></category>
		<category><![CDATA[mono simd programming performance]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=125</guid>
		<description><![CDATA[Acabou de ser lançado versão 2.2 do Mono. Foram vários meses de trabalho e muito suor em corrigir centenas de bugs para podermos fazer nosso melhor release de todos os tempos. Dentro das novidades gostaria de destacar duas relativa ao time que participo. A primeira é o novo JIT baseado em uma representação intermediaria linear, [...]]]></description>
			<content:encoded><![CDATA[<p>Acabou de ser l<a href="http://www.mono-project.com/Release_Notes_Mono_2.2">ançado versão 2.2 do Mono</a>. Foram vários meses de trabalho e muito suor em corrigir centenas de bugs para podermos fazer nosso melhor release de todos os tempos. Dentro das novidades gostaria de destacar duas relativa ao time que participo. A primeira é o novo JIT baseado em uma representação intermediaria linear, os ganhos de performance podem chegar em até 50% e, também importante, o código do JIT ficou muito mais simples e extensível.  A segunda novidade, resultado da maior flexibilidade do mono, é a disponibilização preliminar da biblioteca Mono.Simd, que permite usar a unidade vetorial de processadores modernos.</p>
<p>A impossibilidade utilizar a unidade vetorial a partir de linguagens gerenciadas sempre foi uma das principais críticas dos desenvolvedores C e C++ sob a viabilidade em utilizá-las para código rico em calculo matemático. Isso agora é passado e usando mono e C# é possível gerar código com de alta performance similar ao possível com linguagens de baixo nível.</p>
<p>Para se ter uma ideia das possibilidades, um simples exemplo que transforma uma série de vetores com uma mesma matriz chega a ser 3x mais rápido usando Mono.Simd que o código não vetorial em C, Java ou C#. Isso sem perder as vantagens de se utilizar uma linguagem de alto nível e segura. Mas vamos ao código:</p>

<div class="wp_syntax"><div class="code"><pre class="csharp" style="font-family:monospace;"><span style="color: #008080; font-style: italic;">//Primeiro transformação usando ponto flutuante normal</span>
    <span style="color: #0600FF;">public</span> <span style="color: #0600FF;">static</span> <span style="color: #0600FF;">void</span> Transform <span style="color: #000000;">&#40;</span><span style="color: #0600FF;">ref</span> Matrix matrix, <span style="color: #0600FF;">ref</span> Vector vector, <span style="color: #0600FF;">ref</span> Vector result<span style="color: #000000;">&#41;</span>
    <span style="color: #000000;">&#123;</span>
        result.<span style="color: #0000FF;">x</span> <span style="color: #008000;">=</span> vector.<span style="color: #0000FF;">x</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m00</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">y</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m01</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">z</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m02</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">w</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m03</span><span style="color: #008000;">;</span>
        result.<span style="color: #0000FF;">y</span> <span style="color: #008000;">=</span> vector.<span style="color: #0000FF;">x</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m10</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">y</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m11</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">z</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m12</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">w</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m13</span><span style="color: #008000;">;</span>
        result.<span style="color: #0000FF;">z</span> <span style="color: #008000;">=</span> vector.<span style="color: #0000FF;">x</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m20</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">y</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m21</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">z</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m22</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">w</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m23</span><span style="color: #008000;">;</span>
        result.<span style="color: #0000FF;">w</span> <span style="color: #008000;">=</span> vector.<span style="color: #0000FF;">x</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m30</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">y</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m31</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">z</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m32</span> <span style="color: #008000;">+</span> vector.<span style="color: #0000FF;">w</span> <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">m33</span><span style="color: #008000;">;</span>
    <span style="color: #000000;">&#125;</span>
&nbsp;
<span style="color: #008080; font-style: italic;">//Agora usando Mono.Simd</span>
    <span style="color: #0600FF;">public</span> <span style="color: #0600FF;">static</span> <span style="color: #0600FF;">void</span> Transform <span style="color: #000000;">&#40;</span><span style="color: #0600FF;">ref</span> Matrix4f matrix, <span style="color: #0600FF;">ref</span> Vector4f vector, <span style="color: #0600FF;">ref</span> Vector4f result<span style="color: #000000;">&#41;</span>
    <span style="color: #000000;">&#123;</span>
        Vector4f v <span style="color: #008000;">=</span> vector<span style="color: #008000;">;</span>
&nbsp;
        Vector4f r0 <span style="color: #008000;">=</span> v.<span style="color: #0000FF;">Shuffle</span> <span style="color: #000000;">&#40;</span>ShuffleSel.<span style="color: #0000FF;">XFromX</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">YFromX</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">ZFromX</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">WFromX</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
        Vector4f r1 <span style="color: #008000;">=</span> v.<span style="color: #0000FF;">Shuffle</span> <span style="color: #000000;">&#40;</span>ShuffleSel.<span style="color: #0000FF;">XFromY</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">YFromY</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">ZFromY</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">WFromY</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
        Vector4f r2 <span style="color: #008000;">=</span> v.<span style="color: #0000FF;">Shuffle</span> <span style="color: #000000;">&#40;</span>ShuffleSel.<span style="color: #0000FF;">XFromZ</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">YFromZ</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">ZFromZ</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">WFromZ</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
        Vector4f r3 <span style="color: #008000;">=</span> v.<span style="color: #0000FF;">Shuffle</span> <span style="color: #000000;">&#40;</span>ShuffleSel.<span style="color: #0000FF;">XFromW</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">YFromW</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">ZFromW</span> <span style="color: #008000;">|</span> ShuffleSel.<span style="color: #0000FF;">WFromW</span><span style="color: #000000;">&#41;</span><span style="color: #008000;">;</span>
&nbsp;
        r0 <span style="color: #008000;">=</span> r0 <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">row0</span><span style="color: #008000;">;</span>
        r1 <span style="color: #008000;">=</span> r1 <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">row1</span><span style="color: #008000;">;</span>
        r2 <span style="color: #008000;">=</span> r2 <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">row2</span><span style="color: #008000;">;</span>
        r3 <span style="color: #008000;">=</span> r3 <span style="color: #008000;">*</span> matrix.<span style="color: #0000FF;">row3</span><span style="color: #008000;">;</span>
&nbsp;
        result <span style="color: #008000;">=</span> r0 <span style="color: #008000;">+</span> r1 <span style="color: #008000;">+</span> r2 <span style="color: #008000;">+</span> r3<span style="color: #008000;">;</span>
    <span style="color: #000000;">&#125;</span></pre></div></div>

<p>O código usando Mono.Simd fica um pouco mais complexo, principalmente até se entender como Shuffle e outros combinadores funcionam. Porém quando executado, a versão tradicional precisa executar 16 operações de multiplicação e 12 de soma contra 4 multiplicações 3 somas simd na versão vetorizada. A diferença é clara e o números também.</p>
<p>O release 2.2 foi o resultado de muito esforço pelo time por traz do mono e todos seus contribuidores. Esse release, porém, é especial para mim pois Mono.Simd é resultado de alguns meses de trabalho meu e fiquei muito feliz com a repercussão positiva que recebemos &#8211; vários projetos estão estudando como implementar bibliotecas de matemática vetorial usando ela.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2009/01/14/lancado-mono-22-com-estreia-de-monosimd/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>Ode ao C</title>
		<link>http://www.kumpera.net/blog/index.php/2009/01/12/ode-ao-c/</link>
		<comments>http://www.kumpera.net/blog/index.php/2009/01/12/ode-ao-c/#comments</comments>
		<pubDate>Tue, 13 Jan 2009 02:34:40 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[Programming]]></category>
		<category><![CDATA[anger management]]></category>
		<category><![CDATA[language design]]></category>
		<category><![CDATA[C]]></category>
		<category><![CDATA[macros]]></category>
		<category><![CDATA[type systems]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=123</guid>
		<description><![CDATA[A parte que mais odeio no C é ser minha melhor opção. Sim, sério, para aquilo que faço hoje em dia, realmente não existe linguagem melhor. E isso de deixa maluco pois se trata de uma linguagem anacrônica, cheia de problemas enormes que aparentemente toda comunidade de PLR esqueceu de tentar resolver.
Para quem já programou [...]]]></description>
			<content:encoded><![CDATA[<p>A parte que mais odeio no C é ser minha melhor opção. Sim, sério, para aquilo que faço hoje em dia, realmente não existe linguagem melhor. E isso de deixa maluco pois se trata de uma linguagem anacrônica, cheia de problemas enormes que aparentemente toda comunidade de PLR esqueceu de tentar resolver.</p>
<p>Para quem já programou em C, ou mesmo C++, e em uma linguagem de alto nível tais quais C#, Haskell ou LISP sabe o tamanho do sofrimento que é trabalhar com uma ferramenta tão primitiva. Aos incautos não estou me referindo nem me referindo as vantagens óbvias dessas linguagens como gerenciamento automático de lixo, um sistema de tipos rico ou tipagem ou dinâmica[1].</p>
<p>Quando se programa próximo do metal ter um controle e visão muito clara daquilo que é gerado é muito importante, então coisas como verificações inseridas pelo compilador, não ter controle fino sobre a representação dos dados ou simplesmente não podem burlar o sistema de tipos inviabilizam o uso de uma linguagem &#8211; por mais estranho que pareça.</p>
<p>Entretanto usar destes argumentos para defender as relíquias que são C e C++ é temerário. Ambas linguagens foram construídas sob as bases do que era avançado em termos de compiladores nos anos 70 e para a capacidade de processamos do começo dos anos 90. Muita coisa mudou de lá para cá, menos o fato de C++ demorar horrores para compilar.</p>
<p>A primeira grande falha do C, e uma que chama muito a atenção, é o sistema de módulos e compilação separada. Que realmente não existe. Em ambas as linguagens se usa inclusão textual de cabeçalhos com declarações supostamente exportadas por outros módulos do sistema e pronto. O problema disso é óbvio se já tiver trabalhado em projetos grandes. O tempo de compilação individual aumenta sem razão aparente, conflitos com o nome de símbolos ocorrem e, em geral, atrapalham a vida de todos.</p>
<p>Continuando com a questão de processamento de texto. Macros em C provavelmente são o recurso mais importante da linguagem, aquele que a tira da lista de inúteis. É bem freqüente encontrar uma infinidade de truques feitos usando macros para sanar a falta de expressividade da linguagem. Porém tão comum quanto é encontrar gente frustada com a dificuldade de depurar um sistema rico em macros. Ao mesmo tempo, programando um dia com LISP qualquer um enxerga que um grande sistema de macros faz qualquer linguagem medíocre ir muito longe.</p>
<p>Por fim, minha última reclamação é devido ao fato de estar em 2009 e ainda ser obrigado a usar uma linguagem sem inferência de tipos. O artigo do Robin Milner tem quase 31 anos e ainda assim sou obrigado a pagear o compilador com aquilo que ele consegue descobrir sozinho. Inferência de tipos é um recurso ainda mais importante quando falamos de sistemas de tipos mais ricos.</p>
<p>Ainda assim, por algum motivo que me escapa, não existe um substituto usável para C ou C++. Talvez seja pelo fato de tal linguagem não possuir muito acadêmico em termos de papers e PHDs, ou que a enorme parte da comunidade de programadores destas linguagens é cega por achar que são o último biscoito do pacote.</p>
<p>[1]Ou latente, caso tenha um fetiche pelo Fowler.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2009/01/12/ode-ao-c/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Herança não funciona, parte III</title>
		<link>http://www.kumpera.net/blog/index.php/2008/12/01/heranca-nao-funciona-parte-iii/</link>
		<comments>http://www.kumpera.net/blog/index.php/2008/12/01/heranca-nao-funciona-parte-iii/#comments</comments>
		<pubDate>Mon, 01 Dec 2008 14:35:14 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[Programming]]></category>
		<category><![CDATA[Programming language Theory]]></category>
		<category><![CDATA[language design]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=119</guid>
		<description><![CDATA[Em artigos anteriores eu descrevi algum dos problemas associados com herança, ou subtipagem, e questões ligadas a co/contravariância. Porém outra questão me chamou muito a atenção recentemente, é o fato de classes e objetos como normalmente vemos em linguagens com tipagem explícita são uma mistura de conceitos que talvez não deveriam estar juntos.
O que exatamente [...]]]></description>
			<content:encoded><![CDATA[<p>Em <a href="http://www.kumpera.net/blog/index.php/2007/11/13/heranca-nao-funciona/">artigos</a> <a href="http://www.kumpera.net/blog/index.php/2007/12/31/heranca-nao-funciona-parte-2/">anteriores</a> eu descrevi algum dos problemas associados com herança, ou subtipagem, e questões ligadas a co/contravariância. Porém outra questão me chamou muito a atenção recentemente, é o fato de classes e objetos como normalmente vemos em linguagens com tipagem explícita são uma mistura de conceitos que talvez não deveriam estar juntos.</p>
<p>O que exatamente objetos de linguagens comuns, feito C++, oferecem? Basicamente três coisas: layout, interfaces e subtipagem. Uma classe derivada define uma estrutura de dados que é uma extensão do layout daquelas de seus parentes; o mecanismo de funções virtuais é a única forma sã de se definir interfaces; e, por fim, herança é a forma de se definir uma relação de subtipagem entre dois tipos, no caso do C++ classes.</p>
<p>As duas primeiras propriedades são realmente úteis, a terceira é questionável &#8211; mas não vamos atentar para isso agora. Não existe uma razão óbvia para deixar extensão estrutural e interfaces atadas uma a outra. De fato, é uma enorme limitação. Java e C# possuem o mecanismo de interfaces para resolver isso, porém ambas exigem que todas sejam definidas de antemão, ou seja, são uma minúscula fração do número potencial de interfaces que suportam. Ou seja, adora um modelo de interfaces prescritivo e não latente.</p>
<p>Algumas linguagens funcionais resolvem este problema adotando alguma forma de <a href="http://en.wikipedia.org/wiki/Higher-order_logic">tipos de alta ordem</a>*, que permitem uma função ser definida em termos da interface exigida de um objeto e basta este atendê-la para poder ser usado, independente de herança. Pode ser visto, a grosso modo, como um mecanismo equivalente à interfaces no Java ou C# onde cada classe não precisa definir quais suportam, basta implementar os métodos relacionados.</p>
<p>À primeira vista, tipos de alta ordem, ou <a href="http://en.wikipedia.org/wiki/Type_class">classes de tipos</a> na terminologia e implementação do Hakell, podem parecer a mesma coisa que templates do C++, porém a semelhança fica apenas na superfície, templates são um mecanismo de macro-expansão estruturada, não existe como validar uma função em sua definição ou uso, é necessário sempre fazer sua expansão para verificar sua validade. Outra diferença gritante é a ampla possibilidade de compartilhar código entre as várias instanciações de uma função que usa tipos de alta ordem. Existe uma longa literatura sobre o assunto e várias formas de favorecer uso de memória ou performance.</p>
<p>Mas voltando a questão de se subtipagem é uma propriedade interessante ou não para uma linguagem ter. Bom, teoricamente é muito interessante poder definir relações de substituibilidade, mas na prática, a maioria dos frameworks não se valem de tal princípio. Um bom exemplo é o pacote de coleções do Java, ela é toda construída em termos de interfaces e herança é usada como uma forma tosca de promover reuso de código.</p>
<p>O súbito interesse por linguagens funcionais nesses últimos anos vem trazendo a tona uma série de avanços que estas linguagens possuem e estavam até então restritos à comunidade científica. Está mais que na hora para começarmos a repensar todos os antigo erros e quimeras que as linguagens de programação de mercado promovem e começar a pensar como produzir algo que nos permita dar o mesmo salto dos anos 60 que Algol e Fortran garantiram &#8211; e dessa vez nenhum idéia pode ser refém.</p>
<p>*A wikipedia, apesar de extensão não tem uma referencia para tipos de alta ordem, então vou me valer como referencia lógica de alta ordem e deixar como exercício a aplicação do mesmo para teoria de tipos. Type classes do Haskell podem ser construídas aplicando lógica de alta ordem à um sistema de tipos básico como o descrito em &#8220;Basic Simple Type Theory &#8211; Hindley, J. Roger&#8221;.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2008/12/01/heranca-nao-funciona-parte-iii/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Vergonha nacional &#8211; presidente anuncia sua preferência para sucessão</title>
		<link>http://www.kumpera.net/blog/index.php/2008/11/21/vergonha-nacional-presidente-anuncia-sua-preferencia-para-sucessao/</link>
		<comments>http://www.kumpera.net/blog/index.php/2008/11/21/vergonha-nacional-presidente-anuncia-sua-preferencia-para-sucessao/#comments</comments>
		<pubDate>Fri, 21 Nov 2008 17:44:31 +0000</pubDate>
		<dc:creator>kumpera</dc:creator>
				<category><![CDATA[politica]]></category>

		<guid isPermaLink="false">http://www.kumpera.net/blog/?p=117</guid>
		<description><![CDATA[Um pais pode aceitar um terrorista convicta como ministro? E que tal um assaltante de bancos? Por que não os dois? Afinal temos um descontrolado que entregou a casa civil à Dilma Rousseff.
O Presidente Inácio anunciou que ela é sua favorita para 2010. A noticia é boa em um aspecto, significa ainda mais o fim [...]]]></description>
			<content:encoded><![CDATA[<p>Um pais pode aceitar um terrorista convicta como ministro? E que tal um assaltante de bancos? Por que não os dois? Afinal temos um descontrolado que entregou a casa civil à Dilma Rousseff.</p>
<p>O Presidente Inácio anunciou que ela é sua favorita para 2010. A noticia é boa em um aspecto, significa ainda mais o fim da Marta &#8211; e que esta um dia explique seu envolvimento com ONGs durante sua prefeitura.</p>
<p>Porém como eu posso não ficar apavorado com a idéia de ter uma mulher que ficou nacionalmente conhecida pelos escândalos do dossiê dos gastos do FHC e da venda da Varig?</p>
<p>Vamos realmente querer essa mulher, que acredita em sacrificar inocentes* para atingir seus objetivos, como presidente? A hora de agir é essa, não podemos permitir que o Bêbado da Silva use a máquina estatal para fazer a campanha de uma assaltante.</p>
<p>* Ou alguém por acaso acha que o Banespa estava vazio em 1968?</p>
]]></content:encoded>
			<wfw:commentRss>http://www.kumpera.net/blog/index.php/2008/11/21/vergonha-nacional-presidente-anuncia-sua-preferencia-para-sucessao/feed/</wfw:commentRss>
		<slash:comments>18</slash:comments>
		</item>
	</channel>
</rss>
