gccで-msseしても単純なメモリ転送くらいしかベクトル化してくれない。
そして大概の演算は、8時間ちかくかけて書いたSSEコードよりもgccで簡潔に書いた
コードの方が速い。

アセンブラはPICとAVRとMC68くらいでしか使えない。