Annotating All Knowledge

hypothes.isというサイトについて解説します。

Hypothesisとは

Annotate the web, with anyone, anywhere.

https://web.hypothes.is/

Hypothesisは全てのウェブにおける自由な会話を実現しようとするNPOです。上記の公式トップページの文言を直訳すれば、「誰でもどこでもウェブをアノテーション」できることを目的にしているとわかります。

アノテーションとは単語や文章に対して説明的な行間コメントを書き足すこと、転じて何かしら(文章以外にも)に対して情報を付与することです。機械学習の領域では文章や画像などに対してメタデータ(品詞や何が写っているかなど)として付与することを指します。

今回は自然言語処理的な意味でのアノテーションかと期待しましたが違いました。

Hypothesisの目的

Hypothesisの目的は端的に言えば、ウェブ上のあらゆる場所で会話が行われることです。

To enable a conversation over the world’s knowledge.

https://web.hypothes.is/about/

紹介動画を見ればどのような世界を目指しているかがわかるかと思います。

これにより、研究者はどこでもメモを取ることができあらゆる人と協力することができます。教師と学生が使えばテキスト上で直接議論することができます。論文のPDFなど投稿後容易に編集できないものの情報を更新し続けることもできます。

個人的推察

なんとなーく、設立の根底にある想いは言論の自由とかそこら辺のハッカー的思想があるのではないでしょうか。アンチ言論統制的な。(後述しますが完全に想像。)

下は動画の途中で出てくるイメージですが、「コメントが禁止にされているYoutubeにもコメントができる」という絵にしか見えません。もろに。

公式サイトなどにはそのようなことが直接書かれているわけではないので想像ですが、ウェブが中央集権に向かっているという危惧があるのかと推察しました。

ウェブは自由ってよくいうけど、結局のところGoogleとかFacebookとかTwitterの一存で我々の投稿って消されちゃうんですよね(監視元が政府から大企業になっただけで本質変わってなくない?)。もちろんその一存は大抵モラルという名の多数派意見に則っているわけで、一見真っ当な判断に見えます。

でも差別的表現を投稿できなくしたり、見つけ次第削除したり、そういう一種の情報統制が正しいのかなと思うことはあります。なんだか臭いものには蓋をしろ的な、見えなければ存在しないというごまかし的な、そういう欺瞞を感じます。

差別的発言させろって言ってるわけではないんです。でも世の中には玉石混交が溢れているはずで、そうあるべきで、石を隠して除けることで見た目綺麗になって意味があるのかなって。もちろん石を投げられて傷つく人がいるわけで、そういった状況は好ましくない。ゆえの除石作業なんでしょうが。

加えて言えば玉石の選別が一企業に委ねられていていいんですか?という疑問もあります。その選別基準、真っ当な多数派意見の中に利己的なもの紛れ込ませてませんか?って疑ってしまいます。

話が逸れてしまいましたが、とにかくそんな思想が根底にあるのではないかと想像しました。あくまで想像。なぜならそんなことはHypothesisの理念には一言も書かれえていないからです。

むしろ逆に「Our Principles」ではあらゆる信条も政治的立場も表明しないって書いてあるんです。面白いですね。

Neutral

Favor no ideological or political positions.

https://web.hypothes.is/principles/

実際に試してみた

まぁ思想の話とか、背景の推察とかそんな面白い話は置いておいて、実際にどのように動作するかChrome extensionを入れて試してみます。


拡張ツールを入れたらアカウント登録、アクチベート、拡張機能を有効にしてログインします。Hypothesis公式ページの変化を見比べてみます。

Web & PDF Annotation無効状態

https://web.hypothes.is/

Web & PDF Annotation有効状態

https://web.hypothes.is/

黄色い部分は誰かがハイライトもしくはアノテーションした部分です。この部分をクリックすると誰がハイライトしたか、あるいはアノテーションの内容がどんなものか見ることができます。さらにそれに対してのコメントも見ることができます。

https://web.hypothes.is/

軽く使ってみます。文章をドラッグするとAnnotateとHeighlightというアイコンが出ます。Heighlightを使うと黄色いハイライトを残すことができ、Annotateを使うとハイライトに加えてアノテーションとして何かしらの内容を残すことができます。

https://web.hypothes.is/

アノテーションはマークダウンで書くことができ、画像を貼ることもできます。また、別途タグをつけることもできます(自然言語処理的にコーパス作成に使える可能性を感じる)。

Annotating All Knowledge

2015年Hypothesisを筆頭に40の学術出版社、プラットフォーム、図書館、技術パートナーなどが連合体を立ち上げました。それがAnnotating All Knowledgeです。

目的の一つは特定のプラットフォームや出版社などに限定されない形でのコメントや議論を提供する標準的手法の確立です。

現在我々が論文を読んだ後に情報を共有しようと思ったら、TwitterやFacebook、Slackなどにリンクを貼ってそのプラットフォーム上で情報共有をします。しかし、その情報にアクセスできる人間は限定されてしまいます。それよりも、その論文なり記事なりに直接コメントを残せた方が多くの人の目に触れてより活発な議論が期待できます。

先に触れたようにHypothesisのツールを使えばサイト提供者とは独立してアノテーションができます。コメント機能が提供されていないコンテンツに対してもコメントができます。

参加団体が語るウェブ上の学識への標準的アノテーションツールの意義についてはこちらの動画をご覧ください。

参加団体はパッと見てもELSEVIER・PLOSなどの出版社、arXivなどのプレプリントサーバ、MIT・Cambridge・Oxfordなど大学系の出版局など錚々たる顔ぶれです。

https://hypothes.is/annotating-all-knowledge/

さて、コンセプトは壮大ですが、実際にどれほど利用されているのでしょうか。試しにarXivのtopペーパーを選んで表示してみます。

選ばれたのはGANでした。

http://www.arxiv-sanity.com/top?timefilter=alltime&vfilter=all

何を持ってtopとしているかはわかりませんが、尋常じゃなく注目が集まっている論文であることは間違い無いです。

が、コメント0。

残念です。そもそもHypothesisとAnnotating All Knowledge関連のサイト・記事でしかアノテーションを確認できませんでした。

普及にはインセンティブが必要ですね。

そもそもで言えば、研究者というのは大抵自分らのコミュニティを持っていてそこの相手とはオフラインなり既存のSNSで十分に繋がっている事が想定されます。その仲間がいない新しいツール、使うかって言ったらよーっぽど便利じゃ無い限り乗り換えないですよね。

残念。コンセプトはすごく共感するけど、これだけユーザが盛り上がっていないコミュニティで私も発言するモチベーションが湧きません。

All KnowledgeをAnnotatingできる日はもうしばらく後になりそうです。そっちより機械的にアノテーションする方が希望が持てます。

Bioscience at Hypothesis

ところでBiocienceの領域に特化したプロジェクトもあるそうです。

2016, 2017年でいくつかのカンファレンスでの活動実績があるようですが、論文として発表されている成果はなさそうです。

最後に、Hypothesisトップに残されていたコメントがイケていたので紹介して終わります。思想は好きだよ思想は。

That is DEMOCRACY, isn’t it?

by crinog

参考

コメントを残す