08/12/31 19:27:47
>>554に、8コア(スカルトレイル環境?)でmake buildworldが10分ちょっととあったので
Phenom 9350e(ネガティブクアッドコア、2GHz)で /tmp、/usr/src、/usr/obj を md にして試してみた。ソースは今日のcurrent
# time make -j16 buildworld TARGET=amd64 TARGET_ARCH=amd64 >& /dev/null
5064.936u2325.352s 35:51.40 343.5% 6565+2106k 16382+9269io 16440pf+0w
だいたい36分。このままだとPhenomIIに代えても、10分とかかなり無理よ
1コアで-j4って聞くので、-j16にしてみた
ところで、いつも make buildworld/buildkernel/installworld/installkernelの時に「TARGET=amd64 TARGET_ARCH=amd64」をつけてるんだけど、これって毎回必須?
portsをmakeする時はつけてないんだけど、こっちもいらない?
582:581
08/12/31 19:33:00
iozone で 2000Mbyteのファイルを書かせてみたけど、writeは220Mbyte/secぐらいしかでない。sataのDISKの倍ぐらいしかでない
md遅いね
583:名無しさん@お腹いっぱい。
08/12/31 19:34:52
>>581
TARGET_ARCH The target machine processor architecture. This is
analogous to the ``uname -p'' output. Set this to
cross-build for a different architecture.
TARGET The target hardware platform. This is analogous to
the ``uname -m'' output. This is necessary to
cross-build some target architectures. For exam-
ple, cross-building for PC98 machines requires
TARGET_ARCH=i386 and TARGET=pc98.
584:581
08/12/31 21:50:39
-j8にして /tmpと/usr/objだけmdにしたら30分になった
手持ちのもう一台のAthlon64 5200+(1Mキャッシュの旧型)だと50分ぐらい
585:名無しさん@お腹いっぱい。
09/01/01 01:53:40
tmpfs使えばもう少し高速になる。
恐らくR/W性能だけならmdとtmpfsで倍くらい違う。
586: 【大吉】 【362円】
09/01/01 03:02:35
今年の64bit
587:名無しさん@お腹いっぱい。
09/01/01 03:05:50
ネガティブクアッドコアって突っ込むとこか?
588:581 【大吉】 【1681円】
09/01/01 06:13:59
よくみたら>>347で、Dual Core Opteron*2の、計4コアOpでも10分とある。
値段も足回りも相当違うし、クロックも違うだろうけど、コア数同じだし、兄弟CPUだし、「PhenomはAthlon64より25%ほどIPCがいい」
ってAMDが昔言ってたし、いけるんじゃねと思ったわけですが
>>585
tmpfs試したら、writeが330Mbyte/secぐらいまで行った。メモリはungangedモードで。
しかし、buildworldはたいして早くならず。
というか、3回目で気づいたんだけど、user time はいつも5000sec程度、CPU使用率 350%程度なのはあまり変化無し。
この状態で、例え system timeが0になったとしても、5000sec/3.5=24分程度よりは短縮できないわけで、、超無理
試しにUbenchしたら
Ubench CPU: 447621
Ubench MEM: 66423
--------------------
Ubench AVG: 257022
メモリの値がかなり悪い。世間ではPhenomは30万ぐらいでてようなのに、うちのはたったの6万6000。なんてこったい/(^o^)\
これが原因かな?デバッグオプションは外してるはずで、何でこんなことになるのか謎
ちょっと見直してきます
見直すとこ思い当たらないけど
589:名無しさん@お腹いっぱい。
09/01/01 06:58:58
BIOSじゃねぇの?
590:名無しさん@お腹いっぱい。
09/01/01 10:56:22
デバッグオプションが山ほどついたアレでナニしているとか
591:名無しさん@お腹いっぱい。
09/01/01 22:16:50
8コアで make buildworld 30分ってありえないよ。
うちの3年前のAthlon 64 x2(2GHz) でも30分ちょっとだ。
592:名無しさん@お腹いっぱい。
09/01/02 06:45:37
NetBSDだけど、ウチもPhenom遅いな。
clockの低いOpteron(DELL PowerEdge T105)
の方が全然速い。なんでだろ?
L3$がそんなに効いてるとは思えんのだが。
593:名無しさん@お腹いっぱい。
09/01/02 18:19:11
Op1352(4core 2.1GHz), DDR2-667 2GB にて昨日の7-stable(実質7.1)
# time -h make -j6 buildworld > /tmp/build.log
25m5.43s real 1h10m43.09s user 15m5.31s sys
/tmpと/usr/objがtmpfs、/usr/srcはuzipなmd(メモリ上)
2回目以降はキャッシュに乗るから確か30秒くらいは縮んだはず。
-j4と-j8も試してみたけど、-j6が一番速かった。
srcが非圧縮だとまた違うかもしれないが、-j6では数秒しか変わらず。
>>581よりはまだマシな結果だけど、>>591と大して変わらないのか……
594:名無しさん@お腹いっぱい。
09/01/02 18:27:15
え?うちのathlon64 3500+(2.2GHz)でも 7.1RC2の make -j2 buildworld は
22分ぐらいだよ?
595:名無しさん@お腹いっぱい。
09/01/02 18:38:38
あ、うそうそ
22分はbuildkernelだ
buildworldは1時間ちょっとだよ
ごめんよ
596:593
09/01/02 19:02:02
>>588
こちらも同じく悲惨な結果になってしまった。
Unix Benchmark Utility v.0.3
Copyright (C) July, 1999 PhysTech, Inc.
Author: Sergei Viznyuk <sv@phystech.com>
URLリンク(www.phystech.com)
FreeBSD 7.1-PRERELEASE FreeBSD 7.1-PRERELEASE #2: Fri Jan 2 03:55:25 JST 2009
Ubench CPU: 465467
Ubench MEM: 48385
--------------------
Ubench AVG: 256926
同機種、以前のデータ
FreeBSD 7.1-PRERELEASE FreeBSD 7.1-PRERELEASE #0: Mon Sep 29 02:28:35 JST 2008
Ubench CPU: 467283
Ubench MEM: 106032
--------------------
Ubench AVG: 286657
何故か突然MEMが半速になっている……意味が分からん。
ついでにメモリが180MB/sしかでないK6-2+のスコアがこれ。
FreeBSD 7.1-PRERELEASE FreeBSD 7.1-PRERELEASE #0: Fri Jan 2 14:59:42 JST 2009
Ubench CPU: 24191
Ubench MEM: 12893
--------------------
Ubench AVG: 18542
AM2+とOpなのにメモリがSocket7の4倍速なのか。orz
597:名無しさん@お腹いっぱい。
09/01/02 19:11:13
>>594
ああ、びっくりした。
変な最適化オプションでもつけっぱなしだったかと確認しにいったよ。
-O2 -pipe だけだったから、strict-aliasing付け忘れてたけど、たぶん
そんなには変わらないと思う。
ついでにubenchも最適化なしだったから最適化ありで再計測してみた。
Ubench CPU: 541522
Ubench MEM: 179045
--------------------
Ubench AVG: 360283
コンパイルオプションだけでMEMが4倍になりますた。
……このベンチって信頼できるものなのか?
598:581
09/01/02 22:11:52
何か、i386の結果報告とamd64の結果報告がごちゃ混ぜになってる気がする。
FreeBSD/amd64のbuildworldは64bit版と、lib32セットも作るから、FreeBSD/i386のbuildworldとはコンパイル量は全然違うよ。
その後、該当のマシンに64bit VISTAを突っ込んでCrystalMarkを回したところ、他の人と同じスコアでした。
なのでハードウェア/BIOS周りは正常なようです。
【総合ベンチ】CrystalMark 2004【R2】
スレリンク(jisaku板)
>>596-597
ubenchなんだけど、その後 -ms、-m とかオプションつけて何度か実行していたら、数倍のスコアが出たり、0になったりと
結構めちゃめちゃなことになったので無視することにしました。ぐぐったら、同様にわけわからないことになってる人もいたし。
あと、buildworldについては、他にも2.2GHzのAthlon64で、3030.97 real 4522.13 user 614.92 sys な人もおり、user time を比べる限り、
やはりうちの結果は正常なようです。
>>591
うちは4コアだけど、Athlon64 X2(2GHz)でその結果っておかしくね?FreeBSD/i386の環境でi386のbuildworldしてね?
うちもi386のbuildworldなら、FreeBSD/amd64環境でも Phenom(2GHz)で20分ちょい、Athlon64(2.6GHz)で30分。
>>594-595
うちは、Phenom(2GHz)でのbuildkernelなら12分ぐらい。デバッグオプション全部外したさっきのCURRENT
というか、シングルコア2.2GHzで1時間ちょいって、その結果も実はFreeBSD/i386のbuildworldの結果だったりしね?
ということで、総合すると>>347、>>591、>>594-595はbuildkernelもしくはi386のbuildworldの誤報。>>554は8コアintelなので何の報告なの
か不明。だと思うな。
599:581
09/01/02 22:39:11
メモリテストですが、 URLリンク(home.comcast.net) のBandwidth source code * Version 0.15. の中のLinuxバイナリを直接実行したら(makeでこけたので)こんな感じ
ungangedモード
--------------------------------------------------------
All tests are 32-bit:
L1 cache sequential read 12287.2 MB/sec
L1 cache sequential write 10102.7 MB/sec
L2 cache sequential read 7403.94 MB/sec
L2 cache sequential write 6334.72 MB/sec
Main memory sequential read 2090.4 MB/sec
Main memory sequential write 1546.45 MB/sec
gangedモード
--------------------------------------------------------
All tests are 32-bit:
L1 cache sequential read 12301.4 MB/sec
L1 cache sequential write 10103.4 MB/sec
L2 cache sequential read 7403.75 MB/sec
L2 cache sequential write 6333.94 MB/sec
Main memory sequential read 2173.31 MB/sec
Main memory sequential write 1587.58 MB/sec
ports/benchmark/streamはGangedモードでこんな感じ。通常利用はUngangedモードなんですが、、
-------------------------------------------------------------
Function Rate (MB/s) Avg time Min time Max time
Copy: 4078.4505 0.0079 0.0078 0.0079
Scale: 3947.6963 0.0081 0.0081 0.0081
Add: 4459.7522 0.0108 0.0108 0.0108
Triad: 4418.3512 0.0109 0.0109 0.0109
-------------------------------------------------------------
600:名無しさん@お腹いっぱい。
09/01/02 22:39:36
ああなるほど
601:名無しさん@お腹いっぱい。
09/01/02 22:42:26
>>598
おみそれしました
602:名無しさん@お腹いっぱい。
09/01/02 23:07:01
>>593
> srcが非圧縮だとまた違うかもしれないが
殆ど変らないはず。
603:名無しさん@お腹いっぱい。
09/01/02 23:12:50
>>598
おっしゃるとおり594-595はi386 の誤報でした
604:名無しさん@お腹いっぱい。
09/01/04 11:41:33
で、やりなおし
シングルコア2.2GHzでamd64 buildworldは1時間36分 desu
605:名無しさん@お腹いっぱい。
09/01/04 16:39:48
シングルコア2.2GHzでamd64 make -j 2 buildworldは1時間36分2秒
96分2秒
5762秒
5400+ 2.8GHz x2 で amd64 make -j 4 buildworld は 42分31秒
2551秒
Phenom買ってこようかな…
606:名無しさん@お腹いっぱい。
09/01/04 17:11:29
1月10日にPhenomIIが出るぞ
AM2+版
607:名無しさん@お腹いっぱい。
09/01/04 17:24:42
俺のマシンたぶん対応しないし
出てから値下がりするのまちかな
608:名無しさん@お腹いっぱい。
09/01/05 01:40:18
>>604-605
HP ML115G1にPhenom載せても動かんぞ。
609:名無しさん@お腹いっぱい。
09/01/05 01:44:02
>>608
G5も持っているから大丈夫
610:名無しさん@お腹いっぱい。
09/01/05 01:45:59
心配ありがとう
611:名無しさん@お腹いっぱい。
09/01/05 11:10:55
>>609
PowerPC G5ですね。わかります。
612:名無しさん@お腹いっぱい。
09/01/05 14:27:12
FreeBSD/ppcはまだ PowerPC G5をサポートしていないみたいだネ!
613:名無しさん@お腹いっぱい。
09/01/06 02:05:07
FreeBSD 7.1登場、CPUコアとスレッドを結びつける機能
URLリンク(journal.mycom.co.jp)
614:名無しさん@お腹いっぱい。
09/01/06 17:24:22
ストレージの条件揃えないと比較できないっしょ
マウントオプションも
615:名無しさん@お腹いっぱい。
09/01/06 17:25:31
そんな小さいこと気にスンナよ!
616:名無しさん@お腹いっぱい。
09/01/06 19:39:07
>>615
素人乙
一度asyncでも付けて試してみなよ
617:名無しさん@お腹いっぱい。
09/01/07 05:41:08
で、>>616が試した結果はまだ?
618:名無しさん@お腹いっぱい。
09/01/07 09:02:01
5400+ 2.8GHz x2 で obj を ayncでマウントしたら amd64 make -j 4 buildworld は 42分31秒
2551秒
obj を softupdateでマウントしたのと一緒でした
619:名無しさん@お腹いっぱい。
09/01/08 10:31:00
> 618
実用するならasyncよりもatimeのほうがいいかな。
softupdate有効時のasyncは無意味。
620:619
09/01/08 10:32:09
誤 atime
正 noatime
だた。
621:名無しさん@お腹いっぱい。
09/01/09 12:15:54
/usr/obj を SSDにマウントしたら早くなるかしらん?
622:名無しさん@お腹いっぱい。
09/01/09 12:24:16
>>619
softupdate 有効 async 無効
softupdate 無効 aynnc 有効
これで比較しました