direwolfとTNC test CDのTrack 2を使ったベンチマーク、OpenBSD-5.9/i386 + gcc-4.2.1でもやってみました。リファレンスは"gcc 4.6.3 running on Ubuntu 12.04.05. Intel(R) Celeron(R) CPU 2.53GHz. Appears to have only 32 bit instructions. Probably from around 2004 or 2005."です。
| Reference | A8-3820 | Vortex86EX | Atom N270 | options |
| 524 | 309 | 12318 | 882 | |
| 183 | 90 | 5736 | 373 | -O2 |
| 182 | 92 | 5744 | 307 | -O3 |
| 183 | 90 | 5702 | 310 | -O3 -ffast-math |
| 184 | N/A | N/A | N/A | -Ofast |
| 189 | 91 | 5719 | 318 | -O3 -ffast-math -march=pentium |
| --- | 98 | 5642 | 375 | -O3 -ffast-math -march=pentium2 |
| 122 | 90 | N/A | 379 | -O3 -ffast-math -msse |
| 122 | 99 | N/A | 385 | -O3 -ffast-math -march=pentium -msse |
| --- | 91 | N/A | 374 | -O3 -ffast-math -march=pentium2 -msse |
| 121 | 90 | N/A | 307 | -O3 -ffast-math -march=pentium3 |
| 120 | 92 | 5643 | 308 | -O3 -ffast-math -march=native |
Atom N270は2008年くらいのNetBookによく使われていたCPUですが、300秒台が出るなら十分使えると判断できます。これに比べると86duino EduCakeに載っているVortex86EX/300MHzは…壊滅的に遅いです。こういう非常に遅いマシンでどうやって使うかを考えるのは楽しそうですが、素直にRaspberry Pi/2を買ってくる方が建設的でしょうね(Makefile.linuxによれば、Raspberry Piでは890秒前後、Raspberry Pi 2では420秒前後になります)。
A8-3820上でXubuntu 15.10(i686) + gcc-5.2.1を使用した場合はどうなるかについても、見てみました。
| options |
| 342 | |
| 86 | -O2 |
| 87 | -O3 |
| 86 | -O3 -ffast-math |
| 85 | -Ofast |
| 87 | -O3 -ffast-math -march=pentium |
| 87 | -O3 -ffast-math -march=pentium2 |
| 47 | -O3 -ffast-math -msse |
| 66 | -O3 -ffast-math -march=pentium -msse |
| 50 | -O3 -ffast-math -march=pentium2 -msse |
| 50 | -O3 -ffast-math -march=pentium3 |
| 37 | -O3 -ffast-math -march=native |
OpenBSDで-msseオプションを有効にしても時間が全然短縮されず、AMDのCPUってSSEの処理速度が遅いのかな?と思っていたのですが、単にgcc-4.2がSSEを使った最適化が得意ではないからと考えてよいのでしょうね。-march=nativeを使うときっちり性能が向上しています。
最後に、A8-3820上でXubuntu 15.10(amd64) + gcc-5.2.1を使用した場合の結果を。
| options |
| 378 | |
| 96 | -O1 |
| 94 | -O2 |
| 95 | -O3 |
| 100 | -O3 -march=native |
| 53 | -O3 -ffast-math |
| 52 | -Ofast |
| 45 | -O3 -ffast-math -march=native |
こちらも-ffast-mathを使うと性能が向上していますが、i686より速いかと聞かれると「うーん…」と言いたくなる結果です。
OpenBSDでもportsにgcc-4.9.3が入っていますので、これを使えばここまで速くなるかどうかは分かりませんが、システム標準のgcc-4.2.1よりはマシな結果になると期待できそうです。60.10kg(14:10)