07/09/21 00:15:35
今日いろいろ簡単なテストプログラムを組んでいたのですが
かなり大きな配列を含む範囲を
単にパラレルリージョンに指定しただけのプログラムは
1CPUのときの1/3程度まで低下すると言う現象がありました。
(並列化を指定すると4CPUで3.8倍程度にちゃんとなりました)
同じ動作をするスレッドが複数あってメモリが競合してるんですかね?
あしたスレッドチェッカーの体験版でも落として調べてみます。
>>121
今日試してみたところうちの環境では
100000回ループするプログラムの内と外に
$omp parallel ~ $omp end parallel
をおいたプログラムをそれぞれ比較したのですがほとんど差はありませんでした。
リージョン内は簡単な内容だったのですが、
リージョン内のプログラムの内容によってもスレッド生成・消滅のオーバーヘッドは変わってくるんですかね?
>>122
並列化の指定をする前にまず並列化予定の範囲をパラレルリージョン指定して
ちゃんと動くのかを確認したかったのです。
長文失礼