生物物理計算化学者の雛

主に科学に関する諸々を書き留めています。

分子動力学計算で使われる水モデルの構造と使用頻度

分子動力学(MD)計算において最も頻繁に使われる分子として水分子H2Oがあります。 水そのものの性質を調べることはもちろん、それ以外にも水溶媒中の生体高分子等の計算にも水分子は必要であり、そのモデルの正確性は結果に大きく影響し重要です。 3相互作…

エレベータの代わりに階段を使うことによるダイエット効果

先日シンドラー社製エレベータで死亡事故があったことを受けて、同社製のエレベータの緊急点検を実施するまでの間は極力エレベータを使わないようにという通知がありました。 そこでエレベータでなく階段を使うことで、どれだけカロリーを消費できるのかを見…

諸熊奎治先生 文化功労者に選ばれる

本日、文化功労者に理論化学・計算化学分野における大家である諸熊奎治(もろくま けいじ)先生が選ばれたというニュースがありました。 ONIOM法の開発者 諸熊先生はGaussian等の分子軌道(MO)計算プログラムに実装されているONIOM法の開発者として…

DFT計算でB3LYPがどれだけ使われているかを調査

分子の構造やスペクトル等の性質を計算する分子軌道(MO)計算において、適度な計算量で電子相関を取り込めることから密度汎関数(DFT)法がよく使われます。新版 すぐできる 量子化学計算ビギナーズマニュアル (KS化学専門書)作者: 武次徹也,平尾公彦…

Rで三次元のデータ位置を可視化する

R

Rには手軽に三次元描画を行うことができるライブラリ rgl が含まれています。 このライブラリを使うには、まずRコマンドライン上でライブラリインストールを行います。 install.packages("rgl") # CRNのミラーサイトを聞かれたら近い場所(Japan(Tokyo)等…

100万円でどれだけのマシンを調達できるのか

科研費申請の季節です。 多くの大学の教員は科研費締切に向けて研究計画書作成に大忙しです。 研究計画では予算が当たったら何に使うのかを記述する必要があります。 そこで今日は100万円をマシン購入に振り向けたとして、どれだけの計算機資源を確保できる…

電気代の履歴から節電を考える

福島での大地震・大津波をきっかけに生じた深刻な原子力発電所の事故のため、原子力発電所の再稼働が実質的に不可能になっています。 現時点では、関西電力の大飯原発3・4号機を例外として全原発が停止中です。 このために電力需要ピークを乗り切るための…

長期間起動していたHadoopデーモン終了時に「no tasktracker to stop」と失敗する現象への対処

(Hadoop 0.21.0環境) 多数ノードで一斉に tasktracker や datanode を起動する際には $HADOOP_HOME/bin/start-mapred.sh $HADOOP_HOME/bin/start-dfs.shを、また各ノードで起動する際には $HADOOP_HOME/bin/hadoop-daemon.sh start tasktracker $HADOOP_HOM…

MapReduceジョブのOutOfMemoryErrorに対処する

Hadoopジョブを実行しているとよく map や reduce 処理でヒープ領域が足りないというエラーに遭遇します。例えばこれは reduce 実行時にヒープ領域が足りないというエラーメッセージの一部です。(Hadoop 0.21.0 の場合) org.apache.hadoop.mapreduce.task.re…

.cshrcと.bashrcのHadoop関連設定

ちょくちょくcshとbashの両方の設定ファイル(.cshrc, .bashrc)を書く必要があり、そのたびにそれぞれ環境変数の設定やらif文やらの書き方やらが違って混乱するので、まとめておきます。 cshの場合 if ( `hostname` =~ hd* || `hostname` == hserver ) then…

1の補数と2の補数を取り違えていたせいで半日を浪費・・・

Haodop の可変長int型である VIntWritable クラスによって出力したバイナリデータをC言語で読み込むルーチンを作成したのですが、バイナリデータを数値に変換する際に、 VIntWritable は負数を2の補数でなく1の補数で出力していたことに気付かなかったた…

Hadoop SequenceFileフォーマットを実ファイルでチェック

HadoopのSequenceFileフォーマットで記録されたデータを直接読み込む必要性が生じましたので、SequenceFileのフォーマットを調査しました。 なおこの調査はバージョン 0.21.0 で行いました。下図は実際に読み込み処理を作成する必要のあるSequenceFileをバイ…

Windows7マシンによりSSHトンネリング経由でsambaを利用する手順

Windows7マシンからインターネット越しにローカルLAN内部に位置する samba サーバに接続できれば便利だということで調べたところ、方法がわかり実際に接続可能になりましたので手順をまとめておきます。なお以下のサイトの記述を参考にしました。 http://…

CPU周波数上限の制御による消費電力「量」削減

先日の記事(CPU周波数上限の制御による消費電力低減)に「消費電力「量」が気になる」というコメントがありましたので、少し考えてみました。なお計算実行中の消費電力は先日測定した消費電力最大値を取り続けると仮定して考えます。 計算実行時のみマシ…

iPS細胞のノーベル賞に思う分子シミュレーションから見る細胞の巨大さ

山中伸弥教授が「成熟細胞が初期化され多能性をもつことの発見」により2012年度ノーベル医学生理学賞を受賞されました。 大変喜ばしいことです。 iPS細胞のもつ履歴 iPS細胞と関連する話として、先月開催された分子科学討論会の特別講演で発生生物学の大…

CPU周波数上限の制御による消費電力低減

LinuxマシンではCPUの動作上限周波数を変更することが可能です。 (ここでの操作は Fedora, CentOS の両者で動作することを確認しました) この機能によって周波数上限を下げることで、マシンの消費電力を下げることができます。 なお、周波数上限を下げ…

ネットワークトラブル時にはハブのLANケーブル接続部位を変えてみよう

複数コアによる並列MDシミュレーションを実行していた際に、特定のマシンでのみCPU使用率が100%に貼りつかず、計算速度が100%使用時の半分程度まで落ちてしまう現象に遭遇しました。最終的にスイッチングハブのLANケーブル接続ポートを変更…

化学と工業2012年10月号の感想

日本化学会の月刊誌「化学と工業」の2012年10月号が届いたのでざっと読んで印象の残った部分の感想を書きます。 目次は http://www.chemistry.or.jp/journals/kakou/cimok/ci12-10.pdf で見れます(PDFです)。 p.753- 目をサポートする化学 メガネや…

CentOSへのAMBER12のインストール手順

CentOS マシンに AMBER12 のインストールを行ったので手順をまとめておきます。 なお詳細な情報が http://jswails.wikidot.com/installing-amber12-and-ambertools-12 (ただし英語)にまとまっています。原因は不明ですが CentOS 6.2 マシンではコンパイル…

福島県甲状腺癌発生率(1/8万)は過去の平均発生率(1/100万)と有意に異なるのかをフィッシャーの正確検定でチェック(結果:有意な違いがあるとは結論できない)

R

2013/08/21 福島県の甲状腺がんのスクリーニング検査で約19万3千人中44人ががんと確定、または疑いとなったニュースを受けて続きの記事を書きました 検査をすると見つかる甲状腺がんって結構多い(超音波検査で0.5%の発見率)2013/02/13 そもそもこの記事の…

【MD動画】水の蒸発

3年ぶりに動画を作ってニコニコに投稿しました。後で少し解説を書こうと思いますが、ひとまず報告だけ。

CentOS6.2, CentOS6.4へのRインストール

CentOS 6.2マシンへのRインストールに結構手こずったので、インストール手順を記録しておきます。 (2014/6/11追記)CentOS 6.4マシンにも同様にインストールできました。 Rはデフォルトではyumによるインストールはできず、epelからインストールする必要が…

CentOSにおけるintel CPU ターボブースト動作の確認

先日SandyBridge世代CPUの新しい計算機が使えるようになりましたので、従来のマシンとシミュレーション計算時間の比較を行いました。 ・新マシン Xeon E5-2630 2.3GHz 6 core (TurboMax 2.8GHz) ・旧マシン Xeon X5680 3.33GHz 6 core (TurboMax 3.6GHz) ・…

うるう秒によるjava障害と連動して生じたHDFSメタデータ破損からの復帰手順

※本記事ではうるう秒によるjavaの異常と、それに伴って生じたHadoop 0.21.0 HDFSのメタデータ破損からの復旧手順を説明します。なお、本復旧手順は私の環境で上手くいっただけであり、他の環境で同様の手順を行ったとしても復旧できる保証はありませんので、…

CMYKカラーモデルでの黒色

はてなブックマークを眺めていたらこんな記事を発見。 http://ameblo.jp/data-genkou/entry-10492681977.htmlCMYKカラーではシアン(Cyan)、マゼンタ(Magenta)、イエロー(Yellow)、そして黒色を表現するキー・プレート(Key plate)の4種類の成分で色を…

MapReduceジョブ優先度の変更

HadoopのデフォルトのスケジューラはFIFO(First In First Out)なので、MapReduceジョブは投入順に実行されます。 そのため長時間かかるMapReduce処理を流していると、他のMapReduce処理は長時間またされることになります。この場合、先に実行したい処理の優…

PowerPointで印刷時に半透明が縞模様になるのを回避する

パワーポイントで図形を半透明にすることができますが、印刷時に縞模様になってしまいます。 Microsoftのサポートページ(http://support.microsoft.com/kb/815001/ja)によるとこれは仕様だから、あきらめて印刷用途では半透明を使わないようにするか、ある…

Hadoop-0.21.0 ブラウザからの[Download this file]時のエラー

Hadoopではブラウザ上で以下のようにファイル内容を表示させることができ、ファイルをダウンロードすることが可能です。 しかしながら、私の環境のHadoop-0.21.0では Download this file を押すと以下のようなエラーがでてしまい、ダウンロードできません。 …

複数ディスク使用によるHDFS読込処理パフォーマンス向上

大容量データ処理といえば Hadoop!! と大いに流行っていることもあって、最近は Hadoop でいろいろテストしています。少し前に複数ディスクを使うとどれだけ HDFS 読込処理パフォーマンスが向上するか測定したので、その結果を簡単にまとめておきます。 (ht…

ブログ開設

最近は大容量データ処理の必要性に迫られて、分散処理についていろいろ調べてますので、それに関連することをまとめていこうと思います。