生物物理計算化学者の雛

主に科学に関する諸々を書き留めています。

2012-01-01から1年間の記事一覧

火力発電所の環境アセスメント迅速化って?

3.11東北地方太平洋沖地震での福島原発事故以来原子力発電所が順次停止し、夏冬の需要ピーク期の電力供給が綱渡り状態となっています。 この状況を受けて環境アセスメントを迅速化することで、火力発電所の建設期間短縮を目指す動きが報道されています。 htt…

3U12ノードの高集積サーバ is coming soon

サーバ筺体・ベアボーンメーカーであるsupermicro社のウェブサイトに良さそうな新製品の情報が載っていました。 3Uサイズの筺体に12ノードを搭載できる製品であり、「Coming Soon」となっているので近いうちに発売開始されるようです。 各ノードの概要は以下…

ffmpegによる連番画像ファイルから動画への変換

MD計算結果等の動画を作成する際には、まず連番画像ファイルをbmpやpng等の形式で作成し、それを動画に変換します。 この変換はffmpegによりコマンドライン上で行うことができますので、その手順を解説します。 (昔はAdobe Premiereに大量の画像ファイル…

わずかなアミノ酸残基の違いにより異なるフォールド構造になるタンパク質

岩波書店から出版された、分子レベル〜人体レベルまでの生命シミュレーション研究を概観した本を読み始めました。計算と生命 (岩波講座 計算科学 第4巻)作者: 柳田敏雄,木下賢吾,笠原浩太,木寺詔紀,林重彦,江口至洋,高木周出版社/メーカー: 岩波書店発売日: …

各種MD力場によるβヘアピン構造形成の比較動画

タンパク質MDシミュレーションで使われる代表的な力場としてAmber, GROMOS, CHARMM, OPLS 等があります。各力場パラメータにはαヘリックス・βシートといった二次構造のどれを形成しやすいかという傾向があります。各種力場を使ったMD計算での二次構造形…

HDFS保存ファイルのレプリカ数を変更する

Hadoop HDFS上ファイルのレプリケーション数の変更は hdfs dfs -setrep により行います。(バージョンによっては hadoop dfs -setrep) # HDFS上ファイル /user/hoge.txt のレプリカ数を4に変更 hdfs dfs -setrep 4 /user/hoge.txt # HDFS上ディレクトリ /u…

全データノード再起動時は3台以上の同時故障が起こりやすく、Hadoop HDFSデータは要注意

先日設備点検に伴う停電があったのですが、その際の全Hadoop HDFSノードのシャットダウン・再起動により危うくデータを失うところでした。 レプリケーション3ならば2ノードまでの障害は大丈夫 HDFSはデフォルトでレプリケーション数が3であり、3台のデー…

GlusterFSによるリアルタイムバックアップ多重化

シミュレーションで得られたテラバイトオーダーの大量のデータを解析し、最終的にはExcelやWord等の図表、論文原稿としてまとめます。 この「まとめファイル」編集はWindowsマシンのHDD上で行うことが普通であり、頻繁にバックアップを取るよう努めています…

化学と工業2012年12月号の内容

目次は http://www.chemistry.or.jp/journals/kakou/cimok/ci12-12.pdf で見れます(PDFです)。 ペットケアの科学 p.927- ここ数年の犬・猫の飼育数は増えており、犬が1200万頭、猫が950万頭という数になっている。中高年の子育てを終えた世代がペットを飼…

PDBファイルをExcelで編集する

PDBフォーマット タンパク質構造データベース(PDB)には、X線結晶解析・NMR等の手法で測定されたタンパク質や塩基等の生体高分子の立体構造が登録されています。その情報はPDBファイル形式(座標データ部分のフォーマット詳細はこのリンク先を参照)で取得…

複数ファイルの列データを1ファイルにまとめる

下記のように複数のファイル(ファイル名はd1.txt, d2.txt, d3.txtとする)に列データが分散している状態から、単一ファイルにまとめるシェルコマンド・スクリプトを紹介します。 cat d*.txt ==> d1.txt <== 1.00 11.575308 2.00 11.388116 3.00 11.786263 4…

なぜTIP3Pモデルを使うのか

以前に分子動力学シミュレーションの水モデルとしてTIP3Pモデルが最も良く使われていることを調べました。(分子動力学計算で使われる水モデルの構造と使用頻度) その時にも書きましたが、TIP3Pモデルには拡散係数が実験値より2倍以上大きいという欠点があ…

D.E.Shaw ResearchとMD専用機Anton

MD計算専用計算機Antonにより通常の計算機とは別格のMD計算速度を実現し、ミリ秒スケールの桁違いに長いシミュレーションを実現したことで有名なアメリカの研究所 D E Shaw Research とその主催者 David E.Shaw博士についてまとめました。参考資料 http:…

ヘリウム原子内包フラーレン(C60)、ドデカヘドラン(C20H20)のMD動画

ヘリウム原子を内包しているフラーレン(C60)とドデカヘドラン(C20H20)の分子シミュレーションを実行し、動画を作成しました。 フラーレンだと広い空洞内をHe原子は動き回ることができますが、ドデカヘドランではほとんど身動きが取れないことがわかりま…

Rにより結合エネルギー関数フィッティングを行う

昨日行ったHe-He間距離に対する結合エネルギーカーブをRによってフィッティングしてみました。6-12 LJ型の関数およびモース型関数に対してフィッティングを行いました。 6-12 LJ型関数 εは平衡距離での結合エネルギー(前回MO計算では 0.00152 kcal/mol)、…

He原子の6-12レナードジョーンズ相互作用項の分子軌道計算による算出を試みた

ヘリウム(He)原子を含む系のMD計算を行おうとしたところ、AMBERのGAFF汎用力場にHe原子の6-12レナードジョーンズ(LJ)相互作用パラメータが存在せず、さらに少し調べた範囲では数値が出てこなかった。(Universal Force Field の論文にはLJ関数パラメー…

分子構造データベースまとめ

MD計算やMO計算を実行するための初期構造は単純な分子であれば自分の手で作成することも可能ですが、複雑な分子では手作業での作成は大変です。 そのような場合はデータベースからX線回折等の実験により得られた結晶構造を用いることになります。 生体高分子…

分子動力学計算で使われる水モデルの構造と使用頻度

分子動力学(MD)計算において最も頻繁に使われる分子として水分子H2Oがあります。 水そのものの性質を調べることはもちろん、それ以外にも水溶媒中の生体高分子等の計算にも水分子は必要であり、そのモデルの正確性は結果に大きく影響し重要です。 3相互作…

エレベータの代わりに階段を使うことによるダイエット効果

先日シンドラー社製エレベータで死亡事故があったことを受けて、同社製のエレベータの緊急点検を実施するまでの間は極力エレベータを使わないようにという通知がありました。 そこでエレベータでなく階段を使うことで、どれだけカロリーを消費できるのかを見…

諸熊奎治先生 文化功労者に選ばれる

本日、文化功労者に理論化学・計算化学分野における大家である諸熊奎治(もろくま けいじ)先生が選ばれたというニュースがありました。 ONIOM法の開発者 諸熊先生はGaussian等の分子軌道(MO)計算プログラムに実装されているONIOM法の開発者として…

DFT計算でB3LYPがどれだけ使われているかを調査

分子の構造やスペクトル等の性質を計算する分子軌道(MO)計算において、適度な計算量で電子相関を取り込めることから密度汎関数(DFT)法がよく使われます。新版 すぐできる 量子化学計算ビギナーズマニュアル (KS化学専門書)作者: 武次徹也,平尾公彦…

Rで三次元のデータ位置を可視化する

R

Rには手軽に三次元描画を行うことができるライブラリ rgl が含まれています。 このライブラリを使うには、まずRコマンドライン上でライブラリインストールを行います。 install.packages("rgl") # CRNのミラーサイトを聞かれたら近い場所(Japan(Tokyo)等…

100万円でどれだけのマシンを調達できるのか

科研費申請の季節です。 多くの大学の教員は科研費締切に向けて研究計画書作成に大忙しです。 研究計画では予算が当たったら何に使うのかを記述する必要があります。 そこで今日は100万円をマシン購入に振り向けたとして、どれだけの計算機資源を確保できる…

電気代の履歴から節電を考える

福島での大地震・大津波をきっかけに生じた深刻な原子力発電所の事故のため、原子力発電所の再稼働が実質的に不可能になっています。 現時点では、関西電力の大飯原発3・4号機を例外として全原発が停止中です。 このために電力需要ピークを乗り切るための…

長期間起動していたHadoopデーモン終了時に「no tasktracker to stop」と失敗する現象への対処

(Hadoop 0.21.0環境) 多数ノードで一斉に tasktracker や datanode を起動する際には $HADOOP_HOME/bin/start-mapred.sh $HADOOP_HOME/bin/start-dfs.shを、また各ノードで起動する際には $HADOOP_HOME/bin/hadoop-daemon.sh start tasktracker $HADOOP_HOM…

MapReduceジョブのOutOfMemoryErrorに対処する

Hadoopジョブを実行しているとよく map や reduce 処理でヒープ領域が足りないというエラーに遭遇します。例えばこれは reduce 実行時にヒープ領域が足りないというエラーメッセージの一部です。(Hadoop 0.21.0 の場合) org.apache.hadoop.mapreduce.task.re…

.cshrcと.bashrcのHadoop関連設定

ちょくちょくcshとbashの両方の設定ファイル(.cshrc, .bashrc)を書く必要があり、そのたびにそれぞれ環境変数の設定やらif文やらの書き方やらが違って混乱するので、まとめておきます。 cshの場合 if ( `hostname` =~ hd* || `hostname` == hserver ) then…

1の補数と2の補数を取り違えていたせいで半日を浪費・・・

Haodop の可変長int型である VIntWritable クラスによって出力したバイナリデータをC言語で読み込むルーチンを作成したのですが、バイナリデータを数値に変換する際に、 VIntWritable は負数を2の補数でなく1の補数で出力していたことに気付かなかったた…

Hadoop SequenceFileフォーマットを実ファイルでチェック

HadoopのSequenceFileフォーマットで記録されたデータを直接読み込む必要性が生じましたので、SequenceFileのフォーマットを調査しました。 なおこの調査はバージョン 0.21.0 で行いました。下図は実際に読み込み処理を作成する必要のあるSequenceFileをバイ…

Windows7マシンによりSSHトンネリング経由でsambaを利用する手順

Windows7マシンからインターネット越しにローカルLAN内部に位置する samba サーバに接続できれば便利だということで調べたところ、方法がわかり実際に接続可能になりましたので手順をまとめておきます。なお以下のサイトの記述を参考にしました。 http://…