メイン

2012年09月13日

Cytoscapeで華麗なベン図・オイラー図を描く

* ベン図とオイラー図

ベン図 Venn diagram
集合を直径の等しい円で表す。3つの集合の関係まで図示できる。
オイラー図 Euler diagram
要素の数に応じて面積を変化させて複数の集合の関係を図示する。すべての円が交わる必要はない。

* 使用するツール

以下を使えるようにする。詳しくはGGRKS。
  • Cytoscape v2.8.1
  • プラグイン groupTool v1.3
  • プラグイン VennDiagram v.0.5

* 入力ファイル

タブ区切りで以下のファイルを作成
MEMBER1	alpha,beta
MEMBER2	alpha
MEMBER3	beta
MEMBER4	gamma
MEMBER5	alpha,beta,gamma
MEMBERX	alpha,beta
MEMBERY	alpha

*インポート

  1. File>New>Network>Empty Network
  2. File>Import>Network from Table (Text/MS Excel)...を選択
  3. Imput Fileで先ほど作ったファイルを指定
  4. Source InteractionでColumn1を指定,Interaction TypeとTarget Interactionはそのまま。
  5. Importをクリック
  6. File>Import>Attribute from Table (Text/MS Excel)...を選択
  7. Imput Fileで先ほど作ったファイルを指定
  8. AttributesはNodeが選択されているのでそのまま
  9. Clumn 2右クリック
  10. ListのList of Stringsを選択し,"List Delimiter is"に","(カンマ)を指定してOK
  11. Importをクリック
  12. Data Panelの"Node Attribute Browser"をえらび「□チェックマーク」アイコンをクリック。"ID", "Colimn1", "Column2", "cytoscape.alias.list"が表示されるはず。ネットワークのノードを複数選択して,うまく属性がインポートされていることを確認。
  13. Plugins>Venn Diagrams...を選択
  14. まずはプラグインを認識させるだけ。Doneをクリック。
  15. Plugins>Group Tool...を選択
  16. Create By Attributesで"Column2"を選択
  17. Select Viewerで"Venn/Euler Diagrams"を選択
  18. beta, gamma, alphaすべてを選択
  19. 左上のアイコンを押すと出力。左から「オイラー図」「ベン図」「テーブル」

euler.png

venn.png

続きを読む "Cytoscapeで華麗なベン図・オイラー図を描く" »

2012年05月30日

NGS現場の会第二回研究会@大阪

*NGS現場の会第二回研究会

NGS現場の会第二会研究会が5月23日~25日に大阪の万博記念公園前のホテル阪急エキスポパークにて開催されました。

去年に引き続き2度目の参加ですが、今年は、会員情報係として、主に参加申し込み関連でスタッフとして参加しました。他のスタッフのみなさんの忙しさが最高潮に達しているとき、ワタシは概ね仕事を終えてすっかりリラックスして大阪に向かったのでした。

では忘れないうちに、感想をつらつらと書いてみたいと思います。

*NGS入門チュートリアル

シークエンサーメーカーによるチュートリアルはいろいろな場で開催されています。その中で、この研究会のチュートリアルの特徴は、ライブラリ調整→シークエンシング→データ解析の流れを、各社がお互いのプレゼンテーションを関連付けながら一体感をもって解説していったことでしょう。プレゼンテーターの中にはスタッフとして運営に参加されていた方もいらっしゃったことも、単なる宣伝ではない面白い雰囲気のチュートリアルだったと思います。

*基調講演

大会長の中村さんのプレゼンテーションがすごかった!!ちなみに、あのプレゼンテーションがすべてPowerPointの機能でつくられているとのことで、それにも驚きでした。さらに畳みかけるように最新データ満載。今後の展開をふくめ分厚い発表でした。

寺内さんの講演は、かなり印象深いものでした。イネの研究があれほど熱いとは!静かな語り口と、静かなオープニングから(じつは期待していなかった)、後半の盛り上がり。すごかったです。

將口さんの講演は、寺内さんの講演を聴いていますから、もうだまされないぞ、と最初から集中して聞かせていただきました。ゲノムを読む、ということの真のおもしろさを知ることができました。

*ポスターセッション

楽しかったです。時間的にはちょうどよかったのではないかと思います。これ以上長いと体力的にちょっときつい。いたるところで、声をはりあげていましたら、おわるころにはかなり汗だくになっておりました。

*懇親会と2次会

懇親会では、もうちょっと初めて会う方と話が出来ればよかったなあと思います。これは運営うんぬんではなくて、個人的なスキルが必要ですよね。少々お酒が入った時点でふらふらしてしまったのが反省点。2次会は、タタミの部屋で行われたのですが、すごい人数と熱気でしたねえ。こんだけのヒトが、飲みながらディープな研究の話をしているのですから壮観でした。ワタシも12時すぎには、もう声が出なくなってしまいました。

*パラレルセッション

これは、全部聞きたかったんですけども、結局パネルディスカッションを聞きに行きました。パネラーの皆さんは既に論客?として知られている方ばかりですので、期待をうらぎらないおもしろさでした。ワタシもちょっと発言してみたりもしました。これについては後述。

*ワールドカフェ

去年に引き続いてことしもワールドカフェが行われました。屋外でなかったのが残念かなと思う一方、マイクやプロジェクターでの進行や、テーブルがある点などを考えると屋内も捨てたもんじゃないと思うんですが、いかがでしょうか?時間は、この微妙にものたりない長さが絶妙かなとおもいます。改善点としては、第一回のような大きな紙のほうが絶対いいはずです。次回は、終わったら容赦なく捨ててしまうことにして、大きな紙にどんどん書き込むのがいいんじゃないでしょうか。話しながらガンガン書いていくのはけっこう楽しいものですよ。

*雑感

ワタシの研究分野は「ヒトの遺伝学」なわけですが、正直に言ってちょっとこの分野に関しては物足りなさが残りました。その理由を考えていたのですが、パネルディスカッションを聞かせていただいて、ちょっとわかったような気がします。

今回のパネルディカッションのテーマは「NGSがコモディティとなった時、成すべきサイエンスは何か」だったわけですが、human geneticsの分野においては、もうNGSはコモディティ=日常的/常識的な技術になってしまっているのではないでしょうか。実際、現在のhuman geneticsの研究でエクソーム解析を考慮しないプロジェクトはあり得ませんし、試薬もシークエンサーもプロトコールも解析ワークフローも成熟の域に達しています。コストも(特に受託解析で)急激に下がっています。もちろん、実際にやってみなければわからないようなノウハウはたくさんあるのですが、今や正しい研究デザインで正しく解析すれば、必ず結果(エクソン内の変異に起因する単一遺伝子病の原因遺伝子の発見)にたどりつくことは明白です。とすると、もう、学会で情報収集するような段階ではない、ということになるのでしょう。

ただ、今の方法でのgene huntingで「狩りつくす」時が来ます。必然的に多因子遺伝病や、プロモーター、UTR、miRNAなどなど、できればやりたくなかった領域を相手に格闘しなくてはならない時がきます。その時を 見据えて、なんでも吸収してやるとの意気込みで来年も参加したいと思っています。

それと、解析ワークフローがコモディティなら、それを隠す意味もないということになります。この辺は、オープンソースとしての公開もふくめて推し進めていきたいなと思っています。

*最後に

出席者約450名。(ワタシ以外の)スタッフのみなさんのがんばりと消耗はかなりのレベルに達していたと思います。この苦労と引き替えに、参加者全員に、確かにここには熱いコミュニティーが存在する!という共通認識ができたんではないかと思います。これは、今の日本のサイエンスにとって小さくない事件だと思うのです。

2012年03月04日

NGS現場の会第二回研究会@大阪参加申し込み受け付け開始!

定期的な更新をすでにあきらめた感のある当blogですが,依然として著者は生きております。

さて,時のたつのははやいもの。NGS現場の会第二回研究会@大阪が,満を持して参加申し込み受け付け開始!となりました.

次世代シークエンサーの導入・応用・将来について,アカデミア/企業の垣根をとっぱらって,インフォーマル(夜はお酒も入る)に徹底的に語り明かすことのできる,またとない機会になると思います。

ワタシも,参加登録の管理などの仕事でスタッフとして参加させていただいてます。

詳細は

* NGS現場の会ホームページ http://ngs-field.org/

* NGS現場の会第二回研究会のページ http://ngs-field.org/meeting/2nd

をご参照下さい。

それでは,5月23・24・25日に大阪/ホテル阪急エキスポパークでお会いしましょう!

(本物の太陽の塔を見られるのも楽しみ♪)

2011年06月06日

NGS現場の会第一回研究会

NGS現場の会という会があります。民間/アカデミアを問わず,次世代シークエンサーに関する知識の共有を目指す集まりです。ワタシはGoogleで検索中に偶然見つけ,参加することにしました。

NGS現場の会は,これまで,ネット上での活動をメインにしてきたようですが,ワタシが参加してから間もなく,2011年5月28日から29日まで,熱海にて「第一回研究会」が開かれることがアナウンスされました。これはおもしろそうだぞ!とは思ったのですが,熱海ってどこにあるんだろ・・と調べたところ,品川から新幹線で40分。長崎からは飛行機+京急+新幹線。行けるじゃん。ボスからもOKをいただき,参加できることになりました。

今回の参加の最大の目標は,NGS業界の中で,自分は一体どのへんに位置するのかを見極めることでした。結論からいうと,目的は十分に達成できました。自分の興味/レベル/分野の熱さetcを,見極めるというより,体感することができたわけです。

地理的な条件もあり,またそもそもNGS関連の仕事をはじめて長くないこともあり,直にNGSに関して議論する機会というのがこれまであまりありませんでした。ただ,去年の分子生物学会(BMB2010)のバイオインフォマティクス関連のセッションに参加することで,尋常ならざる熱さを感じてはおりました。

では,感想を箇条書きで

【オーラルセッション】企業の方・アカデミアの方・ウェット・ドライ,いろいろあってよかった。最近のNGS業界全体のながれを感じるためにも,口演は必要。時間もちょうどよかったかと。

【ワールドカフェ】八谷さんをはじめとするオーガナイザーのみなさんの志の高さを感じさせられた企画。これは,次回,参加者の多くが一回経験した上でやったらかなりのクオリティになりそう。企業の方々から,率直に各社の技術の利点欠点を語っていただいたのが非常に勉強になり,また,とても健全だと思いました。反省点は,ワタシももっとばりばり模造紙に書き込めばよかったということ。正直,燃えた!

【お食事】周りの方と熱く語ってしまいました。話しっぱなしで失礼しました。

【2次会】これも熱かったです。お酒なしで十分ハイになってました。iPadはこういう会では大活躍ですね。自分のプレゼンテーションをささっと見せられますから。

【部屋割り】5人部屋で,ワールドカフェで関心のある分野ごとにわかれていました。これはいいアイディアです。たくさんお話できて,勉強になりまくりでした。

【ポスターセッション】燃えた。超燃え。そもそも,60人の予定が105名で,全員がポスター発表ですので,密度がぎっしりです。奇数/偶数で前立ちの交代があるのをわかってなくて,あまり他の方のポスター前では議論できなかったのが残念でした(でも全部見ました)。自分のポスターの前では,多くの方に興味をもっていただいて,長い説明をさせていただきました。ごめんなさい。ちなみに,ワタシは,「Pwrakeをつかったヒト変異解析ワークフロー管理」というテーマと追加でBioRuby-UCSC-API https://github.com/misshie/bioruby-ucsc-api/についてのポスターでした。終了時にはけっこう疲労困憊してしまいました。

【収穫】高速Java製リードビューアGenomeJack,アライメントソフトウェアLAST。などなど。

あとこの機会にTwitterを始めることに。ユーザー名はmishimahryk。潔く本名と顔写真を使用。かなり勉強になるし研究に有用なことを発見しました。「情報を出す人間にこそ情報が集まる」。これは,ネット上だと非常にわかりやすいことですが,実はネットに限らず,今回の研究会のような場でも同じだなと感じました。

今後,NGS現場の会を中心とした,情報の流れ,熱気,熱意,などなど,すごいことになるんじゃないかという予感と期待を強く感じさせられました。劇燃えの2日間でした。

2011年06月05日

PLoS ONEに論文が掲載されました

2011/5/31付けでPLoS ONEに論文が掲載されました。PLoS ONEは言わずと知れたOpen Access Journalですので,全文PDFでダウンロードできます。

http://dx.plos.org/10.1371/journal.pone.0020589

Identification of Novel Schizophrenia Loci by Homozygosity Mapping Using DNA Microarray Analysis

Naohiro Kurotaki, Shinya Tasaki, Hiroyuki Mishima, Shinji Ono, Akira Imamura, Taeko Kikuchi, Nao Nishida, Katsushi Tokunaga, Koh-ichiro Yoshiura, Hiroki Ozawa

研究にご協力いただいた患者さんとそのご家族に深く感謝申し上げます!

この論文でもRubyとR言語が活躍しております。

2011年04月25日

BioRuby plugin:UCSC API

UCSCゲノムブラウザへのAPIをBioRubyのプラグインとして実装した ライブラリを開発中です。

Jan Aertsさんと,Francesco Strozziさんによる,Ruby-Ensembl-APIとRuby-UCSC-APIを基礎に して作られています。

以下の特徴があります

  • BioRubyのプラグイン
  • O/RマッパーとしてActiveRecordを使用
  • クエリ高速化のためにBin Indexを使用します
  • 通常の「1-based閉区間」でのゲノム領域の指示方法と,内部で使われる「0-based半開区間」自動的に変換します。
  • ローカルにインストールしたMySQLサーバーも使えます
  • ローカルにダウンロードした2bitファイルから,リファレンスの塩基配列を得られます
  • RSpecをテスティングにつかっています
  • Hg19とHg18の完全対応をめざしています

gem install bio-ucsc-apiでインストールできます。

関連サイトは以下のとおり

GitHub
http://github.com/misshie/bioruby-ucsc-api
RubyGems
http://rubygems.org/gems/bio-ucsc-api

まだまだ仮リリースですが,ご意見をいただけると,とてもうれしいです。

2010年12月16日

BMB2010でポスター発表してきました

神戸ポートアイランドで開かれたBMB2010(分子生物学会/生化学学会) にてポスター発表をしてきました。

タイトルは「Key-value storeを用いた大規模ゲノムデータ処理の高速化」。 Rubyを使ったデータ検索/処理の話で,カラカラにdryな内容です。

分子生物学会に参加するのは,本当に久しぶりでした。合同大会ということもあり, その規模にびっくりしました。また,カバーする範囲も広く,発表のスタイルも, 生化とバイオインフォマティクスではこんなに違うんだなあとおどろきました。

また,ポスター前で,興味をもっていただいた方々をお話できて,舞い上がってしまいました。 一方的に話してどうもすみませんでした…。

とにかく,熱気あふれる(ポスター会場は物理的な熱気でしたが),いい学会でした。

2010年11月28日

R言語のX11ウィンドウ再描画トラブル

CentOS 5.5/KDE/XVNCの環境でR言語/GNU Rを使っているのですが, X11のウィンドウが他のウィンドウに隠れた際などに必要な再描画をしてくれず, リサイズして強制的に表示させて対処していました。とてもうっとうしいので 解決法を探していたのですが,見つからない。そこでR 2.12.0インストールを期に もういちど解決にチャレンジしてみました。

試行錯誤の結果,どうやらX11(type="nbcairo")とすると,解決するようです。 "nbcairo"はNo Buffered CAIRO を意味します。描画速度も目に見えて速くなりました。

ホームディレクトリの~/.Rprofileに

setHook(packageEvent("grDevices", "onLoad"),
        function(...) grDevices::X11.options(type="nbcairo"))

と追加すると,X11()のデフォルトがnbcairoになります。

これが,私の環境の,どのコンポーネントのせいなのか,いまだわかりませんが,一応解決しました。 同じようなトラブルの方もいるやもしれませんので,ここに書いておきます。

2010年10月31日

UCSCBin is now on RubyGems.org

UCSCBin 0.2.2

Ruby utility library for UCSC Bioinformatics Genome Browser ( http://genome.ucsc.edu ) including calculation of a BIN index from a genomic interval to speed-up SQL queries, and conversion between 1-based full-closed (for humans) and 0-based half-open (for machienes) intervals.

* Install : gem install UCSCBin

* RubyGems.org: https://rubygems.org/gems/UCSCBin

* GitHub.com: http://github.com/misshie/UCSCBin

というわけで

UCSCゲノムブラウザーのMySQLデータベースからの検索で威力を発揮するRubyライブラリを作って RubyGems.orgで公開しました。gem一発でインストールできます。

機能は,物理位置の範囲からBINインデックスを計算すること(範囲を含む最小インデックスを返す,あるいは範囲内の情報を持つ可能性のあるインデックス全てを返すクラスメソッド)と,0-base左閉半開区間と,1-base閉区間(こっちが普通の範囲)を変換するクラスメソッドを実装してます。

普段はつかわないと思うのですが,512Mbase以上の位置のためのExtended indexは未サポートです。