2018年10月30日 / 最終更新日時 : 2018年10月30日 roy29fuku 論文解析 マウスの系統表現② 正規表現で系統を検索 正規表現でマウスの系統表現を検索。予想通りC57BL/6、BABL/cが多かったです。 ただし、一筋縄でいかない点もあり。。。 前回まで マウスの系統の命名規則について調べました。 特別な遺伝的変異や交配を […]
2018年10月27日 / 最終更新日時 : 2018年10月30日 roy29fuku 論文解析 マウスの系統表現① 近交系、亜系統、ラボコード 論文から動物実験の情報抽出を行なっています。今回は実験動物に関する記述の抽出に挑戦します。 もっともメジャーなマウスの系統についてまとめました。 動物実験 個人の所感ですが、がんや免疫系の論文をザーッと漁っ […]
2018年10月19日 / 最終更新日時 : 2018年10月19日 roy29fuku 論文解析 PubMed分析 PubMedの論文タグを集計して、疾病ごとの論文数推移を見ました。 家畜伝染病・代謝疾患・内分泌系疾患などが伸びていました。 PubMedとは 一言で言えば生命科学論文の検索エンジンです。 少 […]
2018年10月18日 / 最終更新日時 : 2018年10月30日 roy29fuku 論文解析 がんのin vivo論文アノテーション②アノテーションルール EXACT2などを参考に独自のルールでがんの論文をアノテーションします。 前回まで Nature CommunicationとScientific Reportsからがんに関連する論文100本を取得。 うち […]
2018年10月16日 / 最終更新日時 : 2019年4月21日 roy29fuku 自然言語処理 Brat前準備:データと各種設定 Bratのデータ用意と設定ファイルの書き方などをまとめました。 環境構築 前回macOSにBratをインストールしました。 環境などは以下を参照してください。 macOSでBratを使う テキストファイル、アノテーション […]
2018年10月16日 / 最終更新日時 : 2018年10月30日 roy29fuku 論文解析 がんのin vivo論文アノテーション①固有な語彙 がんのin vivo論文をアノテーションします。 今回は対象となる論文*とそれ以外を選り分けました。 *対象論文:動物実験(特にがん細胞の移植、骨髄移植)を含む論文 本記事では便宜的に上記の対象論文、対象条 […]
2018年10月9日 / 最終更新日時 : 2020年1月17日 roy29fuku Web SeleniumでChromeDriverを使ってスクレイピング 2020年1月: ChromeDriverが古いためか起動した際に警告メッセージが出るようになったので全体的に更新。 2018年10月: PhantomJSが2018年3月に更新を終了してしまったので、以前使っていたコー […]
2018年10月3日 / 最終更新日時 : 2019年2月5日 roy29fuku 論文解析 科学論文解析リソースまとめ 生命科学の論文から機械可読な動物実験プロトコルを抽出して、実験の効率化をめざしています。 興味のある方はTwitterでご連絡ください。 ここでは特にライフサイエンスの論文を解析するのに使えそうなデータセットや訓練済みの […]
2018年10月2日 / 最終更新日時 : 2018年10月2日 roy29fuku 論文解析 SCIERC:科学論文の情報抽出データセットをbratで眺める 科学論文のテキストにentity, relationをアノテーションしたデータセットです。 coreferenceも考慮しているので複数文をまたがるentityにもリンクが貼られています。 科学論文からknowledge […]
2018年10月2日 / 最終更新日時 : 2018年10月2日 roy29fuku 論文解析 EXACT2:生命科学の実験プロトコル用オントロジー 生命科学実験の自動化や再現性担保のためにプロトコルを機械可読にすることは大いに意義があります。 しかし現在多くの実験プロトコルは自然言語による自由記述でコンピュータにとっては扱いづらい形式です。 EXACT2は実験プロト […]