慶應義塾大学
2004年度 春学期

Webテキスト処理法
Web Text Processing

2004年度春学期 火曜日2時限
科目コード: 31200 / 2単位
カテゴリ: 19. 専門-共通基盤-ナレッジスキル科目(学部)
開講場所:SFC
授業形態:講義・演習/実習
担当: 萩野 達也
E-mail: hagino@sfc.keio.ac.jp

概要

いろいろな問題解決をWebで行うようになってきているが, そのためには膨大なテキストを処理しなくてはいけない. 検索エンジンはWebのテキストをキーワードに分けて処理をしている. Webテキスト処理法では,このようなテキスト処理の背後にある技術について勉強する. テキストは単なる文字列として与えられるが, これを処理するには,まず単語単位に分割する必要がある. このためには正規表現やオートマトンを用いる. また,文章を適切に処理するには文法的な処理が必要で, このためには構文解析を行う必要がある. 最近のWeb上のデータはXMLで書かれていることも多く, XMLデータの処理についても取り扱う. Webテキスト処理法で学んだ技術は, 単にWebのテキストの処理だけでな く,プログラミング言語の処理(コンパイラ)や自然言語処理などでも 必要となる基礎技術となる.

教材

その他