2018年10月27日 / 最終更新日時 : 2018年10月30日 roy29fuku 論文解析 マウスの系統表現① 近交系、亜系統、ラボコード 論文から動物実験の情報抽出を行なっています。今回は実験動物に関する記述の抽出に挑戦します。 もっともメジャーなマウスの系統についてまとめました。 動物実験 個人の所感ですが、がんや免疫系の論文をザーッと漁っ […]
2018年10月19日 / 最終更新日時 : 2018年10月19日 roy29fuku 論文解析 PubMed分析 PubMedの論文タグを集計して、疾病ごとの論文数推移を見ました。 家畜伝染病・代謝疾患・内分泌系疾患などが伸びていました。 PubMedとは 一言で言えば生命科学論文の検索エンジンです。 少 […]
2018年10月18日 / 最終更新日時 : 2018年10月30日 roy29fuku 論文解析 がんのin vivo論文アノテーション②アノテーションルール EXACT2などを参考に独自のルールでがんの論文をアノテーションします。 前回まで Nature CommunicationとScientific Reportsからがんに関連する論文100本を取得。 うち […]
2018年10月16日 / 最終更新日時 : 2019年4月21日 roy29fuku 自然言語処理 Brat前準備:データと各種設定 Bratのデータ用意と設定ファイルの書き方などをまとめました。 環境構築 前回macOSにBratをインストールしました。 環境などは以下を参照してください。 macOSでBratを使う テキストファイル、アノテーション […]
2018年10月16日 / 最終更新日時 : 2018年10月30日 roy29fuku 論文解析 がんのin vivo論文アノテーション①固有な語彙 がんのin vivo論文をアノテーションします。 今回は対象となる論文*とそれ以外を選り分けました。 *対象論文:動物実験(特にがん細胞の移植、骨髄移植)を含む論文 本記事では便宜的に上記の対象論文、対象条 […]
2018年10月3日 / 最終更新日時 : 2019年2月5日 roy29fuku 論文解析 科学論文解析リソースまとめ 生命科学の論文から機械可読な動物実験プロトコルを抽出して、実験の効率化をめざしています。 興味のある方はTwitterでご連絡ください。 ここでは特にライフサイエンスの論文を解析するのに使えそうなデータセットや訓練済みの […]
2018年10月2日 / 最終更新日時 : 2018年10月2日 roy29fuku 論文解析 SCIERC:科学論文の情報抽出データセットをbratで眺める 科学論文のテキストにentity, relationをアノテーションしたデータセットです。 coreferenceも考慮しているので複数文をまたがるentityにもリンクが貼られています。 科学論文からknowledge […]
2018年10月2日 / 最終更新日時 : 2018年10月2日 roy29fuku 論文解析 EXACT2:生命科学の実験プロトコル用オントロジー 生命科学実験の自動化や再現性担保のためにプロトコルを機械可読にすることは大いに意義があります。 しかし現在多くの実験プロトコルは自然言語による自由記述でコンピュータにとっては扱いづらい形式です。 EXACT2は実験プロト […]
2018年9月29日 / 最終更新日時 : 2018年12月19日 roy29fuku 自然言語処理 macOSでBratを使う 以前生命科学論文のアノテーション済み公開データを使って薬剤のNamed Entity Recognitionをやりました。 Relation Extractionを試みるにあたって自分でアノテーションをやることにしました […]
2018年8月29日 / 最終更新日時 : 2018年8月29日 roy29fuku 自然言語処理 NLP若手の会のハッカソンで賞をもらった話 ACL、NIPSの論文を国別でフィルタリングするサイトを作りました。 参加経緯 東大のアントレプレナーシップ関連で知り合いになった自然言語処理の博士の方に、NLP若手の会なるものがあると教えてもらいました。 […]