Mathematicaに標準で添付されている、MathematicaBenchmarkの結果です。
一番下が、Raspberry Piです。処理速度を求める機材ではないので、ご参考までに。
現住所に移り住んで15年。ダイエット目的で、自宅周辺の散策を始めておよそ1年。デジタルカメラによる写真撮影に興味を持ち始めて半年。ダイエットの継続と写真のスキルアップのために、Blogを始めました。
12/14/2013
12/13/2013
Raspberry PiとMathematica(non-comercial)
すっかりほったらかしにしていたRaspberry Pi.11月末に、Mathematica(Non Comercial)がRaspberry Piに提供開始とのニュースを最近見つけました。
日ごろから研究や実務で使われている方々には、処理速度が遅くて実用的ではないと思いますが、初等から中等教育でのツールとしては十分ではないかと・・。
日ごろから研究や実務で使われている方々には、処理速度が遅くて実用的ではないと思いますが、初等から中等教育でのツールとしては十分ではないかと・・。
10/19/2013
生田緑地 バラ苑
撮影したバラの名前は、できるだけ覚えようと努力します。でも、一日に3種以上覚えられません。花の前のプラカードを写しても、花と一緒に撮影しなかったので、どの花の名前かが後でわからなくなります。この写真も、そんな名前がわからないバラの一種。
Via Flickr:
Sony DSLR-A100,SIGMA 50mm Macro
Via Flickr:
Sony DSLR-A100,SIGMA 50mm Macro
10/12/2013
10/05/2013
カメラ用レインカバーをお試し
午後から程よい小雨になったので、カメラ用レインカバーを試してみました。
50mm Macroでは、レンズが短すぎるのかピントリングが回しにくかったです。
撮影を終えてから気がつきましたが、レインカバー内部ですべての操作をしなければ意味がないはずですが、今日はピントリングだけ外部に露出させて操作していました。
50mm Macroでは、レンズが短すぎるのかピントリングが回しにくかったです。
撮影を終えてから気がつきましたが、レインカバー内部ですべての操作をしなければ意味がないはずですが、今日はピントリングだけ外部に露出させて操作していました。
9/28/2013
Sony α77購入
A100の連写機能があまりに貧弱だったため、運動会用としていまどきのαシリーズ購入を決意。
ヨドバシカメラの売り場担当さんに、上手に言いくるめられ勧められて(自分もそれを望んでいたのだとは思いますが)α77を購入。
既存のA100と、電池やリモートレリースを共有できるα57,65あたりを考えていましたが、店を出るときにはα77を抱えていました。
1日使った時点で、α77の感想。
・(A100と比べて)さほど重くない
・EVTには、違和感を感じない
・ピーキング機能は本当に便利
・(A100と比べて)バッテリー消費が多い
・ボタンがたくさん付いている
・連写が早い!(運動会ぐらいでしか活躍しない機能ですけど)・ファイルが大きい、LightRoomでの読み込みに時間が余計にかかる
・(A100では必ず使っていた)セルフタイマー2秒の擬似ミラーアップをしなくても良いので、露出ブランケットが使えるようになった
・GPS機能は、公園の散策程度でも時折衛星を見失います。(Holux-M241は、今後も散歩のお供として欠かせません。)
A100ですら満足な写真が撮れない状態で、α77に代えても連写速度以外に向上は見込めないと思いますが、2台をうまく使いこなして、再来年ぐらいには自分が納得できる絵が取れるように今後も精進。
9/23/2013
9/22/2013
9/15/2013
雨の合間に一枚
自宅近くのツタで、絞りと被写界震度のお勉強。
マクロの撮影では、開放時の被写界震度は紙1枚の厚みと同じ(おおげさ)であることを確認。
ピント合わせがうまく一発で決まらないので、被写界震度を深くするために絞り値を大きくすることでごまかすことが多い。
断続的に続く雨のため外に出ることができず、いろいろなサイトで皆さんの作品を眺めていたら、自分好みの画像がTamron 90mm Macroが使われていることが多いのを発見。
自分の技量をわきまえずに、ついAmazonでポチッ。
マクロの撮影では、開放時の被写界震度は紙1枚の厚みと同じ(おおげさ)であることを確認。
ピント合わせがうまく一発で決まらないので、被写界震度を深くするために絞り値を大きくすることでごまかすことが多い。
断続的に続く雨のため外に出ることができず、いろいろなサイトで皆さんの作品を眺めていたら、自分好みの画像がTamron 90mm Macroが使われていることが多いのを発見。
自分の技量をわきまえずに、ついAmazonでポチッ。
9/14/2013
9/08/2013
9/07/2013
生田緑地 9月7日
今朝は、きのこを数多く見つけました。Sigma社に調整していただいた、50mmマクロを使って撮影しています。ライブビューができない古い機種(A100)のため、ピンボケを大量に作成してしまいました。調整の前に、腕を上げないと。
Via Flickr:
SONY DSC
Via Flickr:
SONY DSC
8/31/2013
生田緑地 8月31日
sigma 50mm f2.8 macroの初撮り。
(Sony A100)
前日のピントテストでは、開放で4mmほど前ピン。
腕が悪いから、MFでピンボケ量産。
自分を追い込むために、ピント調整をシグマさんにお願いしようか思案中。
8/24/2013
8/08/2013
6/23/2013
USB thermometer-528018
5/27/2013
Raspberry Pi ヒートシンク装着
ヒートシンクセット |
ヒートシンク装着前と後での温度変化を、MRTGのグラフから読み取ろうと努力しました。
1)クリアケースのふたを開けて、温度の変化を確認
2)ふたを開けたまま、ヒートシンクを装着して温度変化を確認。
結果として、ヒートシンク装着前後での温度差は約1度(deg-C)程度でした。ほとんど空気の流れのない室内のため、ヒートシンクからの放熱が効率よくなされていないのだと推測しています。
(ヒートシンク装着前に)ケースのふたを開けることで、約4度の温度低下しています。
ホコリを気にしないのであれば、ケースに入れない方が良いと思われます。
ケースの密閉度は、それほど高くもないようなのでこの結果は意外でした。
温度変化グラフ |
装着前Raspberry Pi |
装着後Raspberry Pi |
5/25/2013
LINUX X64 (AMD64/EM64T) DISPLAY DRIVER (319.23)
5月23日付けで、NVIDIAの新しいドライバが公開されていました。
サンプルのmatrixMulCUBLASの結果が、58GFLOPSから60GFLOPSになりました。(まったく同じ状況での比較ではありません。)
Linux(64bit)のリンクからダウンロード可能です。リリースハイライトをよく読んでから、更新する/しないの判断をして下さい。
※全て自己責任で行って下さい。こちらの掲載情報により破損、故障等発生しても、私は一切責任を取れません。予めご了承下さい。
※全て自己責任で行って下さい。こちらの掲載情報により破損、故障等発生しても、私は一切責任を取れません。予めご了承下さい。
Raspberry Pi MRTG
Raspberry Piに手を出しました。
OSの初期化もSDカードを書き換えるだけなので、仮想マシンのスナップショット(からのリストア)並に楽ちんです。4000円程度とお財布にもやさしいです。
OSとしては、初心者向きと説明がされているRaspbian “wheezy”を使っています。
搭載されているARM11(Broadcom BCM2835)は、CPU温度も容易に取得できるようなので、MRTGでグラフ化してみようと思い立ちました。(既に、多くの先達がおられましたが。)
合わせて購入したヒートシンクの効果を、数値化したいという目的もあります。
MRTG導入途中で、エラーが多発。
# cfgmaker public@localhost > /etc/mrtg.cfg
や
#indexmaker /etc/mrtg.cfg > /var/www/mrtg/index.html
を実行した時に以下のエラーが表示されてました。
"Subroutine SNMP_Session::pack_sockaddr_in6 redefined at /usr/share/perl/5.14/Exp orter.pm line 67."
無い知恵を絞ることなくGoogleさんにお伺いした結果、かなりの方がこの問題にぶつかられているようで、すぐに解決策が見つかりました。
http://kopfkino.irosaurus.com/tutorial-monitoring-mit-mrtg-rrd-support-auf-raspberry-pi-debian-wheezy/
以下のパッチを適用するだけ。
$sudo sed -i 's|import\ Socket6;|Socket6->import\(qw\(inet_pton\ getaddrinfo\)\);|' /usr/share/perl5/SNMP_Session.pm
OSの初期化もSDカードを書き換えるだけなので、仮想マシンのスナップショット(からのリストア)並に楽ちんです。4000円程度とお財布にもやさしいです。
OSとしては、初心者向きと説明がされているRaspbian “wheezy”を使っています。
搭載されているARM11(Broadcom BCM2835)は、CPU温度も容易に取得できるようなので、MRTGでグラフ化してみようと思い立ちました。(既に、多くの先達がおられましたが。)
合わせて購入したヒートシンクの効果を、数値化したいという目的もあります。
MRTG導入途中で、エラーが多発。
# cfgmaker public@localhost > /etc/mrtg.cfg
や
#indexmaker /etc/mrtg.cfg > /var/www/mrtg/index.html
を実行した時に以下のエラーが表示されてました。
"Subroutine SNMP_Session::pack_sockaddr_in6 redefined at /usr/share/perl/5.14/Exp orter.pm line 67."
無い知恵を絞ることなくGoogleさんにお伺いした結果、かなりの方がこの問題にぶつかられているようで、すぐに解決策が見つかりました。
http://kopfkino.irosaurus.com/tutorial-monitoring-mit-mrtg-rrd-support-auf-raspberry-pi-debian-wheezy/
以下のパッチを適用するだけ。
$sudo sed -i 's|import\ Socket6;|Socket6->import\(qw\(inet_pton\ getaddrinfo\)\);|' /usr/share/perl5/SNMP_Session.pm
5/03/2013
LINUX X64 (AMD64/EM64T) DISPLAY DRIVER (319.17)
5月2日付けで、NVIDIAの新しいドライバが公開されていました。
早速入れ替えました。以前との違いは、まったく感じません。
Linux(64bit)のリンクからダウンロード可能です。リリースハイライトをよく読んでから、更新する/しないの判断をして下さい。
※全て自己責任で行って下さい。こちらの掲載情報により破損、故障等発生しても、私は一切責任を取れません。予めご了承下さい。
※全て自己責任で行って下さい。こちらの掲載情報により破損、故障等発生しても、私は一切責任を取れません。予めご了承下さい。
cudaGetDeviceCount returned 38(Tesla M2090)
連休の谷間で時間に余裕があったため、会社に転がっていたTesla M2090を触らせてもらえました。
ビデオ出力は、サーバ機(PowerEdge T420)のオンボードからされます。(当たり前)
CUDA5.0の導入を終えて、OS再起動後にDevice Queryを起動したところ、表題のエラーが表示されました。
先人のお知恵を拝借して、以下のスクリプトを利用してデバイスファイル作成することで解決。
表示された諸元は、以下の通り。
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
Detected 1 CUDA Capable device(s)
Device 0: "Tesla M2090"
CUDA Driver Version / Runtime Version 5.0 / 5.0
CUDA Capability Major/Minor version number: 2.0
Total amount of global memory: 5375 MBytes (5636554752 bytes)
(16) Multiprocessors x ( 32) CUDA Cores/MP: 512 CUDA Cores
GPU Clock rate: 1301 MHz (1.30 GHz)
Memory Clock rate: 1848 Mhz
Memory Bus Width: 384-bit
L2 Cache Size: 786432 bytes
Max Texture Dimension Size (x,y,z) 1D=(65536), 2D=(65536,65535), 3D=(2048,2048,2048)
Max Layered Texture Size (dim) x layers 1D=(16384) x 2048, 2D=(16384,16384) x 2048
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 49152 bytes
Total number of registers available per block: 32768
Warp size: 32
Maximum number of threads per multiprocessor: 1536
Maximum number of threads per block: 1024
Maximum sizes of each dimension of a block: 1024 x 1024 x 64
Maximum sizes of each dimension of a grid: 65535 x 65535 x 65535
Maximum memory pitch: 2147483647 bytes
Texture alignment: 512 bytes
Concurrent copy and kernel execution: Yes with 2 copy engine(s)
Run time limit on kernels: No
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Enabled
Device supports Unified Addressing (UVA): Yes
Device PCI Bus ID / PCI location ID: 10 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 5.0, CUDA Runtime Version = 5.0, NumDevs = 1, Device0 = Tesla M2090
ビデオ出力は、サーバ機(PowerEdge T420)のオンボードからされます。(当たり前)
CUDA5.0の導入を終えて、OS再起動後にDevice Queryを起動したところ、表題のエラーが表示されました。
先人のお知恵を拝借して、以下のスクリプトを利用してデバイスファイル作成することで解決。
表示された諸元は、以下の通り。
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
Detected 1 CUDA Capable device(s)
Device 0: "Tesla M2090"
CUDA Driver Version / Runtime Version 5.0 / 5.0
CUDA Capability Major/Minor version number: 2.0
Total amount of global memory: 5375 MBytes (5636554752 bytes)
(16) Multiprocessors x ( 32) CUDA Cores/MP: 512 CUDA Cores
GPU Clock rate: 1301 MHz (1.30 GHz)
Memory Clock rate: 1848 Mhz
Memory Bus Width: 384-bit
L2 Cache Size: 786432 bytes
Max Texture Dimension Size (x,y,z) 1D=(65536), 2D=(65536,65535), 3D=(2048,2048,2048)
Max Layered Texture Size (dim) x layers 1D=(16384) x 2048, 2D=(16384,16384) x 2048
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 49152 bytes
Total number of registers available per block: 32768
Warp size: 32
Maximum number of threads per multiprocessor: 1536
Maximum number of threads per block: 1024
Maximum sizes of each dimension of a block: 1024 x 1024 x 64
Maximum sizes of each dimension of a grid: 65535 x 65535 x 65535
Maximum memory pitch: 2147483647 bytes
Texture alignment: 512 bytes
Concurrent copy and kernel execution: Yes with 2 copy engine(s)
Run time limit on kernels: No
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Enabled
Device supports Unified Addressing (UVA): Yes
Device PCI Bus ID / PCI location ID: 10 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 5.0, CUDA Runtime Version = 5.0, NumDevs = 1, Device0 = Tesla M2090
VNC導入します。
i35GからX11 Forwardingさせて、手元のマシンで描画させようとしましたが、
以下のエラーが表示れます。
http://stackoverflow.com/questions/7823915/x-forwarding-cuda-sdk-aplication-with-opengl-extensions
他の方々はVNCを使って、問題を回避されているようです。
以下のエラーが表示れます。
http://stackoverflow.com/questions/7823915/x-forwarding-cuda-sdk-aplication-with-opengl-extensions
他の方々はVNCを使って、問題を回避されているようです。
4/25/2013
Geforce GT520 nvidia-smi 限定サポート
内蔵GPUの状態監視が外部から可能かどうかを確認。
nvidia-smiでは、Geforceシリーズについては限定的なサポートのみとの記載あり。
どんな情報が拾えるのかを確認。
搭載されているGPUが廉価版(GT520)なので、冷却FAN、メモリのECCはそもそも存在しません。
ログを残して面白そうなのは、温度ぐらいか。
watanabebashi@i35G:~/NVIDIA_CUDA-5.0_Samples/bin/linux/release$ nvidia-smi
Thu Apr 25 20:15:01 2013
+------------------------------------------------------+
| NVIDIA-SMI 4.310.44 Driver Version: 310.44 |
|-------------------------------+----------------------+----------------------+
| GPU Name | Bus-Id Disp. | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GT 520 | 0000:04:00.0 N/A | N/A |
| 0% 50C N/A N/A / N/A | 1% 2MB / 511MB | N/A Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Compute processes: GPU Memory |
| GPU PID Process name Usage |
|=============================================================================|
| 0 Not Supported |
+-----------------------------------------------------------------------------+
4/20/2013
Giada i35G メモリ追加(自己責任)
CUDAのお勉強用として用意した、MINI PCのメモリを2GB->4GBへ換装。
部品点数は少ないのですが、無線LANやBluetoothのアンテナとマザーボードとがケーブルで直接接続されているため、力任せに作業をするとケーブルや接点を破壊する可能性があります。
(筐体を開いてしまうと、メーカーや販売店さんからの1年間無償保障が得られなくなります。)
※全て自己責任で行って下さい。こちらの掲載情報により破損、故障等発生しても、私は一切責任を取れません。予めご了承下さい。
・筐体の上下をとめているネジ(2つ)を外す。(ネジのうちひとつには、シールが張られています。)
このシールを外すと、1年間の無償保障サービスが得られなくなります。
・カバーを外す
(正面側にプラスチックのツメ(5つほど)で引っかかっています。写真に写っているように、無線LANのアンテナがカバーについており、マザーボードとの間でケーブル接続があります。)
・マザーボードを固定しているネジ(4,5つほど)を外す。
・筐体の上下をふさいでいるプラスチックのふたを外す。
(写真では、左右に分かれている2つの部品です。)
・マザーボードを慎重に裏返す。
(マザーの裏側も、Bluetooth(?)アンテナとマザーとがケーブルでつながっています。)
・メモリに張られている断熱(?)シールを慎重に外す。
・メモリを交換する
・断熱(?)シールを慎重に外す
・マザーボードを元の位置に戻す。
冷却ファンの位置が正しいか、確認する。
・筐体上下を塞ぐふた(写真では左右に分かれています)を戻す
・最初に外したふたを戻す
・ネジ(2箇所)でとめる
(4/26修正)表題の製品名が間違っていたのです修正。正しくは、"Giada i35G"
部品点数は少ないのですが、無線LANやBluetoothのアンテナとマザーボードとがケーブルで直接接続されているため、力任せに作業をするとケーブルや接点を破壊する可能性があります。
(筐体を開いてしまうと、メーカーや販売店さんからの1年間無償保障が得られなくなります。)
※全て自己責任で行って下さい。こちらの掲載情報により破損、故障等発生しても、私は一切責任を取れません。予めご了承下さい。
・筐体の上下をとめているネジ(2つ)を外す。(ネジのうちひとつには、シールが張られています。)
このシールを外すと、1年間の無償保障サービスが得られなくなります。
・カバーを外す
(正面側にプラスチックのツメ(5つほど)で引っかかっています。写真に写っているように、無線LANのアンテナがカバーについており、マザーボードとの間でケーブル接続があります。)
・マザーボードを固定しているネジ(4,5つほど)を外す。
・筐体の上下をふさいでいるプラスチックのふたを外す。
(写真では、左右に分かれている2つの部品です。)
・マザーボードを慎重に裏返す。
(マザーの裏側も、Bluetooth(?)アンテナとマザーとがケーブルでつながっています。)
・メモリに張られている断熱(?)シールを慎重に外す。
・メモリを交換する
・断熱(?)シールを慎重に外す
・マザーボードを元の位置に戻す。
冷却ファンの位置が正しいか、確認する。
・筐体上下を塞ぐふた(写真では左右に分かれています)を戻す
・最初に外したふたを戻す
・ネジ(2箇所)でとめる
(4/26修正)表題の製品名が間違っていたのです修正。正しくは、"Giada i35G"
4/07/2013
OpenFaom導入で躓く ”libfiniteVolume.so: cannot open shared object file: No such file or directory”
すぐに使う予定もないのに、OpenFoamをインストール。
Ubuntu用にインストール手順まで公開されているので、数分で導入完了。
導入がうまく行ったことを確認したところ、以下のエラーが表示。
watanabebashi@i35g:~$ icoFoam -help
icoFoam: error while loading shared libraries: libfiniteVolume.so: cannot open shared object file: No such file or directory
ご指定のライブラリファイルが、"/opt/openfoam220/platforms/linuxGccDPOpt/lib"に存在することを確認しました。
パス設定が正しくされていないのかと考え、.bashrcでの呼び出し位置を変更することで問題回避。この変更点を、一旦元に戻すと現象が再発するので、原因はここにあるのは確かだと思われます。(根本原因を追求するスキルも無いので、記録だけ残しておきます。)
/home/hogehoge/.bashrc 変更前
*********************************************************************************************
(抜粋)
#
#OPENFOAM
#
source /opt/openfoam220/etc/bashrc
#
#CUDA
#
export CUDA_HOME=/usr/local/cuda-5.0
export LD_LIBRARY_PATH=${CUDA_HOME}/lib
PATH=${CUDA_HOME}/bin:${PATH}
export PATH
*********************************************************************************************
/home/hogehoge/.bashrc 変更後
*********************************************************************************************
(抜粋)
#
#OPENFOAM
#
#source /opt/openfoam220/etc/bashrc
#
#CUDA
#
export CUDA_HOME=/usr/local/cuda-5.0
export LD_LIBRARY_PATH=${CUDA_HOME}/lib
PATH=${CUDA_HOME}/bin:${PATH}
export PATH
#
#
#
source /opt/openfoam220/etc/bashrc
*********************************************************************************************
cudaGetDeviceCount returned 38
i35Gの少ない資源(48コア)でより多くの結果を残そうと、CUIでの運用へと変更しました。
具体的な作業は、以下の通り。
sudo gedit /etc/default/grub
変更前:GRUB_CMDLINE_LINUX_DEFAULT="splash quiet"
変更後:GRUB_CMDLINE_LINUX_DEFAULT="text"
[Matrix Multiply CUBLAS] - Starting...
GPU Device 0: "GeForce GT 520" with compute capability 2.1
MatrixA(320,640), MatrixB(320,640), MatrixC(320,640)
Computing result using CUBLAS...done.
Performance= 63.83 GFlop/s, Time= 2.054 msec, Size= 131072000 Ops
Computing result using host CPU...done.
Comparing CUBLAS Matrix Multiply with CPU results: OK
上記の変更以降、OS再起動などを行うと、"cudaGetDeviceCount returned 38"と表示されてサンプルアプリが動作しなくなりました。
先人のお知恵を拝借して、以下のスクリプトを利用してデバイスファイル作成することで解決。
具体的な作業は、以下の通り。
sudo gedit /etc/default/grub
変更前:GRUB_CMDLINE_LINUX_DEFAULT="splash quiet"
変更後:GRUB_CMDLINE_LINUX_DEFAULT="text"
若干の性能向上も見られました。(OSを11.10から12.04へと変更した影響もあるかもしれません。)
[Matrix Multiply CUBLAS] - Starting...
GPU Device 0: "GeForce GT 520" with compute capability 2.1
MatrixA(320,640), MatrixB(320,640), MatrixC(320,640)
Computing result using CUBLAS...done.
Performance= 63.83 GFlop/s, Time= 2.054 msec, Size= 131072000 Ops
Computing result using host CPU...done.
Comparing CUBLAS Matrix Multiply with CPU results: OK
上記の変更以降、OS再起動などを行うと、"cudaGetDeviceCount returned 38"と表示されてサンプルアプリが動作しなくなりました。
先人のお知恵を拝借して、以下のスクリプトを利用してデバイスファイル作成することで解決。
#!/bin/bash /sbin/modprobe nvidia if [ "$?" -eq 0 ]; then # Count the number of NVIDIA controllers found. NVDEVS=`lspci | grep -i NVIDIA` N3D=`echo "$NVDEVS" | grep "3D controller" | wc -l` NVGA=`echo "$NVDEVS" | grep "VGA compatible controller" | wc -l` N=`expr $N3D + $NVGA - 1` for i in `seq 0 $N`; do mknod -m 666 /dev/nvidia$i c 195 $i done mknod -m 666 /dev/nvidiactl c 195 255 else exit 1 fi
ベアメタルバックアップ 準備
会社の検証機を使う場合に備え、ベアメタルバックアップツールを探して、たどり着いた。”Clonezillaを使ってハードディスクを丸々バックアップ”
GPUの検証では、物理OSの利用したいので保険を用意。
GPUの検証では、物理OSの利用したいので保険を用意。
4/06/2013
ATOM D2700 Linpack result
Intelから公開されている、linpack benchmark toolを使って、Gianda i35G(ATOM D2700)の計算能力を測定しました。
Intel benchmarkのうち、runme_xeon32を利用しています。(CPUが、D2700なのでソースからATOMにあわせてコンパイルしたほうが良いのかもしれません。面倒なので、公開されているバイナリをそのまま使いました。)
その結果、D2700は約1GFlopsの計算能力をお持ちだそうです。
実行時間が約4時間強。
Intel benchmarkのうち、runme_xeon32を利用しています。(CPUが、D2700なのでソースからATOMにあわせてコンパイルしたほうが良いのかもしれません。面倒なので、公開されているバイナリをそのまま使いました。)
その結果、D2700は約1GFlopsの計算能力をお持ちだそうです。
実行時間が約4時間強。
4/05/2013
Ubuntu 12.04 LTSへアップグレード
Ubuntu 11.10が2013年4月でサポート終了とのことなので、12.04へアップグレードしました。
同時にNvidia Driverも310.44へ更新。cudaのサンプルも、正常に動いています。
同時にNvidia Driverも310.44へ更新。cudaのサンプルも、正常に動いています。
4/03/2013
55GFlops!
どうにかこうにかCUDAが動く状態に持ち込めたので、
Sampleをいくつか動かして見ました。
[Matrix Multiply CUBLAS] - Starting...
GPU Device 0: "GeForce GT 520" with compute capability 2.1
MatrixA(320,640), MatrixB(320,640), MatrixC(320,640)
Computing result using CUBLAS...done.
Performance= 55.37 GFlop/s, Time= 2.367 msec, Size= 131072000 Ops
Computing result using host CPU...done.
Comparing CUBLAS Matrix Multiply with CPU results: OK
Wikiによると、IBM Deepblueが11GFlopsだから、Giada i35G(GT520)はそのおよそ5倍。
(PS3は、200GFlops越えてますけど)
同じ土俵で比べていない事は理解していますが、雑誌やニュースでしか知らない(昔の)スーパーコンピュータを、数値で越えていることはうれしく感じています。
TFlopsを目指すと電気代もバカにならないので、しばらくは、これでCUDAを勉強していきます。
Sampleをいくつか動かして見ました。
[Matrix Multiply CUBLAS] - Starting...
GPU Device 0: "GeForce GT 520" with compute capability 2.1
MatrixA(320,640), MatrixB(320,640), MatrixC(320,640)
Computing result using CUBLAS...done.
Performance= 55.37 GFlop/s, Time= 2.367 msec, Size= 131072000 Ops
Computing result using host CPU...done.
Comparing CUBLAS Matrix Multiply with CPU results: OK
Wikiによると、IBM Deepblueが11GFlopsだから、Giada i35G(GT520)はそのおよそ5倍。
(PS3は、200GFlops越えてますけど)
同じ土俵で比べていない事は理解していますが、雑誌やニュースでしか知らない(昔の)スーパーコンピュータを、数値で越えていることはうれしく感じています。
TFlopsを目指すと電気代もバカにならないので、しばらくは、これでCUDAを勉強していきます。
4/01/2013
Ubuntu11.0へのCUDA 5.0導入手順
(Ubuntu 11.0)OSの初期導入から始める場合、こちらの情報が頼りになりました。
ここの手順のままで、CUDA5.0の導入とサンプルのコンパイル(すべて)と実行(oceanFFT,smokeParticles)まで、エラーなく進めることができました。
GPUカードのドライバとしてCUDAToolKit添付のものを導入することが、導入に失敗しない勘どころと思われます。
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
Detected 1 CUDA Capable device(s)
Device 0: "GeForce GT 520"
CUDA Driver Version / Runtime Version 5.0 / 5.0
CUDA Capability Major/Minor version number: 2.1
Total amount of global memory: 512 MBytes (536412160 bytes)
( 1) Multiprocessors x ( 48) CUDA Cores/MP: 48 CUDA Cores
GPU Clock rate: 1480 MHz (1.48 GHz)
Memory Clock rate: 800 Mhz
Memory Bus Width: 64-bit
L2 Cache Size: 65536 bytes
Max Texture Dimension Size (x,y,z) 1D=(65536), 2D=(65536,65535), 3D=(2048,2048,2048)
Max Layered Texture Size (dim) x layers 1D=(16384) x 2048, 2D=(16384,16384) x 2048
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 49152 bytes
Total number of registers available per block: 32768
Warp size: 32
Maximum number of threads per multiprocessor: 1536
Maximum number of threads per block: 1024
Maximum sizes of each dimension of a block: 1024 x 1024 x 64
Maximum sizes of each dimension of a grid: 65535 x 65535 x 65535
Maximum memory pitch: 2147483647 bytes
Texture alignment: 512 bytes
Concurrent copy and kernel execution: Yes with 1 copy engine(s)
Run time limit on kernels: Yes
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Disabled
Device supports Unified Addressing (UVA): No
Device PCI Bus ID / PCI location ID: 4 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 5.0, CUDA Runtime Version = 5.0, NumDevs = 1, Device0 = GeForce GT 520
3/30/2013
3/29/2013
CUDA挑戦 下準備
会社が期待する方向からは、斜め上にズレていることは認識していますが、研修を受講して何かを感じたことだけでも吉としています。(いつかは案件に結びつくかもしれないし)
XEONphyのお話を聞いて、GPGPUを利用しての並列計算に挑戦したくなり、(XEONphyに果てが届かないため)Geforce付きの安価なベアボーンDirac i35Gを入手。(たった48coresとはいえ、cuda core付き)
。Ubuntu11.1まではインストールが終わらせましたが、CUDAのダウンロードの待ち時間が長く、CUDAインストールは明日以降にします。
2/21/2013
1/27/2013
1/26/2013
1/20/2013
1/19/2013
1/16/2013
LightRoomキャンペーンに乗っかる
”Adobe Photoshop Lightroom 4 Windows/Macintosh版 特別提供版”がAmazonでお安くなっています。2013年1月16日時点で8000円未満です。ちょうど評価版の試用期限が切れるので、このタイミングで発注しました。
Adobe社のサイトでも、20日までの15%OFFキャンペーンを実施しているようです。Amazonも、このキャンペーンに連動しているのかな。
Adobe社のサイトでも、20日までの15%OFFキャンペーンを実施しているようです。Amazonも、このキャンペーンに連動しているのかな。
1/13/2013
1/12/2013
1/09/2013
1/06/2013
1/05/2013
1/04/2013
登録:
投稿 (Atom)