2018年10月18日 / 最終更新日時 : 2018年10月30日 roy29fuku 論文解析 がんのin vivo論文アノテーション②アノテーションルール EXACT2などを参考に独自のルールでがんの論文をアノテーションします。 前回まで Nature CommunicationとScientific Reportsからがんに関連する論文100本を取得。 うち […]
2018年10月16日 / 最終更新日時 : 2019年4月21日 roy29fuku 自然言語処理 Brat前準備:データと各種設定 Bratのデータ用意と設定ファイルの書き方などをまとめました。 環境構築 前回macOSにBratをインストールしました。 環境などは以下を参照してください。 macOSでBratを使う テキストファイル、アノテーション […]
2018年10月16日 / 最終更新日時 : 2018年10月30日 roy29fuku 論文解析 がんのin vivo論文アノテーション①固有な語彙 がんのin vivo論文をアノテーションします。 今回は対象となる論文*とそれ以外を選り分けました。 *対象論文:動物実験(特にがん細胞の移植、骨髄移植)を含む論文 本記事では便宜的に上記の対象論文、対象条 […]
2018年10月9日 / 最終更新日時 : 2020年1月17日 roy29fuku Web SeleniumでChromeDriverを使ってスクレイピング 2020年1月: ChromeDriverが古いためか起動した際に警告メッセージが出るようになったので全体的に更新。 2018年10月: PhantomJSが2018年3月に更新を終了してしまったので、以前使っていたコー […]
2018年10月3日 / 最終更新日時 : 2019年2月5日 roy29fuku 論文解析 科学論文解析リソースまとめ 生命科学の論文から機械可読な動物実験プロトコルを抽出して、実験の効率化をめざしています。 興味のある方はTwitterでご連絡ください。 ここでは特にライフサイエンスの論文を解析するのに使えそうなデータセットや訓練済みの […]
2018年10月2日 / 最終更新日時 : 2018年10月2日 roy29fuku 論文解析 SCIERC:科学論文の情報抽出データセットをbratで眺める 科学論文のテキストにentity, relationをアノテーションしたデータセットです。 coreferenceも考慮しているので複数文をまたがるentityにもリンクが貼られています。 科学論文からknowledge […]
2018年10月2日 / 最終更新日時 : 2018年10月2日 roy29fuku 論文解析 EXACT2:生命科学の実験プロトコル用オントロジー 生命科学実験の自動化や再現性担保のためにプロトコルを機械可読にすることは大いに意義があります。 しかし現在多くの実験プロトコルは自然言語による自由記述でコンピュータにとっては扱いづらい形式です。 EXACT2は実験プロト […]
2018年9月29日 / 最終更新日時 : 2018年10月18日 roy29fuku 医療 アジアの医療系スタートアップまとめ Galen Growth Asiaが2018年アジアで最もイノベーティブな医療系スタートアップのトーナメントを行なっていると風の噂で聞きました。 トーナメント表を眺めるといくつか知っている日本のスタートアップもあったので […]
2018年9月29日 / 最終更新日時 : 2018年12月19日 roy29fuku 自然言語処理 macOSでBratを使う 以前生命科学論文のアノテーション済み公開データを使って薬剤のNamed Entity Recognitionをやりました。 Relation Extractionを試みるにあたって自分でアノテーションをやることにしました […]
2018年8月29日 / 最終更新日時 : 2018年8月29日 roy29fuku 自然言語処理 NLP若手の会のハッカソンで賞をもらった話 ACL、NIPSの論文を国別でフィルタリングするサイトを作りました。 参加経緯 東大のアントレプレナーシップ関連で知り合いになった自然言語処理の博士の方に、NLP若手の会なるものがあると教えてもらいました。 […]