ゆるゆる更新します。
目次
- 1 要素技術
- 2 Task
- 2.1 Anaphora Resolution: 照応解析
- 2.2 Automated Essay Scoring
- 2.3 Automatic Speech Recognition: 自動音声認識
- 2.4 Automatic Summarisation: 自動要約
- 2.5 Coreference Resolution: 共参照解析
- 2.6 Entity Linking: エンティティリンキング
- 2.7 Grammatical Error Correction: 文法誤り訂正
- 2.8 Grapheme To Phoneme Conversion
- 2.9 Humor and Sarcasm Detection
- 2.10 Language Grounding
- 2.11 Language Guessing
- 2.12 Language Identification
- 2.13 Language Modeling
- 2.14 Language Recognition
- 2.15 Lemmatisation
- 2.16 Lip-reading
- 2.17 Machine Translation: 機械翻訳
- 2.18 Morphological Inflection Generation
- 2.19 Named Entity Disambiguation
- 2.20 Named Entity Recognition: 固有表現抽出
- 2.21 Paraphrase Detection
- 2.22 Paraphrase Generation
- 2.23 Parsing: 構文解析
- 2.24 Part-of-speech Tagging: 品詞タグ付け
- 2.25 Pinyin-To-Chinese Conversion
- 2.26 Question Answering: 質問応答
- 2.27 Relationship Extraction
- 2.28 Semantic Role Labeling
- 2.29 Sentence Boundary Disambiguation
- 2.30 Sentiment Analysis: 感情解析
- 2.31 Sign Language Recognition/Translation
- 2.32 Singing Voice Synthesis
- 2.33 Social Science Applications
- 2.34 Source Separation
- 2.35 Speaker Authentication
- 2.36 Speaker Diarisation
- 2.37 Speaker Recognition: 話者識別
- 2.38 Speech Reading
- 2.39 Speech Recognition
- 2.40 Speech Segmentation
- 2.41 Speech Synthesis
- 2.42 Speech Enhancement
- 2.43 Speech-To-Text
- 2.44 Spoken Term Detection
- 2.45 Stemming
- 2.46 Term Extraction
- 2.47 Text Similarity
- 2.48 Text Simplification
- 2.49 Text-To-Speech
- 2.50 Text-To-Speech
- 2.51 Transliteration: 翻字
- 2.52 Voice Conversion
- 2.53 Voice Recognition
- 2.54 Word Embeddings: 単語埋め込み
- 2.55 Word Prediction
- 2.56 Word Segmentation
- 2.57 Word Sense Disambiguation: 語義の曖昧性解消
- 3 PyTorch入門
- 4 学習教材
要素技術
言語資源
- 言語資源とは
- 辞書
- シソーラス
- コーパス
- 言語資源リスト
- コーパスを自作する
前処理
- 前処理とは
- クリーニング
- 文分割
- 単語分割
- 形態素解析
- N-gram
- 正規化
- Stop Wordsの除去
- Sparse Termsの除去
素性(特徴)
- 素性とは
- One hotベクトル
- Bag-of-Words
- Bag-of-Ngrams
- TF-IDF
- 分脈ベクトル表現
- Word Embeddings
構文解析
- 再帰下降構文解析
- Shift-Reduce構文解析
- 左隅構文解析器
- 適応部分文字列表
意味解析
- 照応解析
検索アルゴリズム
Task
NLPのタスクは多岐に渡る上に、区分の仕方が実社会の課題ベースになっているのできっちりかっちり分けることはできません。
とはいえ分類しないと概観もできないので以下のページを参考にタスクの分類を行います。
興味のあるところをピックアップして更新していきます。
メモとしてymym3412さんのACLサマリーのリンクを貼っておきます。
Anaphora Resolution: 照応解析
Automated Essay Scoring
Automatic Speech Recognition: 自動音声認識
Automatic Summarisation: 自動要約
- Unsupervised Abstractive Meeting Summarization with Multi-Sentence Compression and Budgeted Submodular Maximization #241
- A Unified Model for Extractive and Abstractive Summarization using Inconsistency Loss #221
- Fast Abstractive Summarization with Reinforce-Selected Sentence Rewriting #219
Coreference Resolution: 共参照解析
Entity Linking: エンティティリンキング
Grammatical Error Correction: 文法誤り訂正
Grapheme To Phoneme Conversion
Humor and Sarcasm Detection
Language Grounding
Language Guessing
Language Identification
Language Modeling
Language Recognition
Lemmatisation
Lip-reading
Machine Translation: 機械翻訳
Morphological Inflection Generation
Named Entity Disambiguation
Named Entity Recognition: 固有表現抽出
Paraphrase Detection
Paraphrase Generation
Parsing: 構文解析
- Extending a Parser to Distant Domains Using a Few Dozen Partially Annotated Examples #242
- Improving a Neural Semantic Parser by Counterfactual Learning from Human Bandit Feedback #235
- Zero-Shot Transfer Learning for Event Extraction #174
- Linear-Time Constituency Parsing with RNNs and Dynamic Programming #151
Part-of-speech Tagging: 品詞タグ付け
Pinyin-To-Chinese Conversion
Question Answering: 質問応答
Relationship Extraction
Semantic Role Labeling
Sentence Boundary Disambiguation
Sentiment Analysis: 感情解析
Sign Language Recognition/Translation
Singing Voice Synthesis
Social Science Applications
Source Separation
Speaker Authentication
Speaker Diarisation
Speaker Recognition: 話者識別
Speech Reading
Speech Recognition
Speech Segmentation
Speech Synthesis
Speech Enhancement
Speech-To-Text
Spoken Term Detection
Stemming
Term Extraction
Text Similarity
Text Simplification
Text-To-Speech
Text-To-Speech
Transliteration: 翻字
Voice Conversion
Voice Recognition
Word Embeddings: 単語埋め込み
Word Prediction
Word Segmentation
Word Sense Disambiguation: 語義の曖昧性解消
PyTorch入門
PyTorchのチュートリアルに沿ながら自然言語処理についてざっくりと触れます。
- PyTorch 入門 -Mac book proでチュートリアル-
- PyTorch DL for NLP -イントロダクション-
- PyTorch DL for NLP -bag of wordsで英語とスペイン語を分類-
- PyTorch DL for NLP -単語埋め込み、n-gram、CBOW-
- PyTorch DL for NLP -LSTM-
- PyTorch DL for NLP -Bi-LSTM CRF-
学習教材
入門 自然言語処理
言語処理のための機械学習入門