理想のNGSデータ解析パイプライン

Get Started. It's Free
or sign up with your email address
理想のNGSデータ解析パイプライン by Mind Map: 理想のNGSデータ解析パイプライン

1. カスタマイズ

1.1. 新しいツールを追加

1.2. 多様なアプリケーションに対応

1.3. 実験条件への対応

2. HPC

2.1. ジョブスケジューラ対応

2.2. 大規模ストレージ連携

2.3. 大規模データアップロード

3. 出力

3.1. ポジコン/ネガコンチェック

3.2. 実験条件の自動推定

3.2.1. fastqからアプリケーション名を推定

3.3. QCデータをサマライズ/アラート

3.3.1. mapping score

3.3.2. QV

3.4. グローバルな統計量

3.4.1. read数

3.4.2. mapping rate

3.4.3. 論文に必ず必要になる

4. ポリシー

4.1. 論文指向

4.1.1. 論文に必要となる図

4.1.2. 論文に必要となる統計量

4.2. 検証実験指向

4.2.1. 詳細な解析の時間をかせぐ

4.2.2. データが出たらすぐるにゲノムブラウザでデータがみれる

4.2.2.1. それをみてすぐに検証実験が組める

4.2.2.2. ポジコンネガコンのゲノム領域がすぐに見える

5. 永続性

5.1. 開発チームの安定性

5.2. 解析ログ

5.2.1. データベースのバージョン

5.2.2. ソフトのバージョン

5.2.3. 結果のバージョン管理

5.2.3.1. バージョン間の比較閲覧

5.2.3.1.1. パイプライン設計時に必要

5.2.4. ラボノートとのリンク(ブログ)

5.3. 運用

5.3.1. システム更新の簡便さ

5.3.2. 最低でも5年の運用に耐える

5.3.2.1. 一般的なプロジェクトの時限

5.3.3. 設定の簡便さ

6. パーソナライズ

6.1. 閲覧制限

6.1.1. プロジェクトごと

6.1.2. 研究者ごと

7. 公共性

7.1. オープンソース

7.2. データ公開機能

8. UI

8.1. ゲノムブラウズ

8.1.1. 解析結果をすぐみられる

8.1.1.1. 詳細な結果の前に実験生物学者がみられる

8.1.2. 多サンプルが閲覧しやすい

8.1.2.1. マルチレイヤ

8.1.2.2. 時系列

8.1.3. 軸のオートスケール

8.1.3.1. すべてのサンプルが連動して同じスケールになる

8.2. 解析の進捗把握

8.3. 公共データも閲覧

8.3.1. オープンになった類似のNGSデータ

8.3.2. リファレンストランスクリプトーム

8.3.3. リピート

8.3.4. %GC