書誌事項
人文学のためのテキストデータ構築入門 : TEIガイドラインに準拠した取り組みにむけて / 人文情報学研究所監修, 石田友梨, 大向一輝, 小風綾乃, 永崎研宣, 宮川創, 渡邉要一郞編
東京 : 文学通信, 2022.07
[424]p ; 26cm
ISBN: 9784909658845
解題
人文学研究におけるテキストデータの効果的な蓄積・共有・継承のための、TEI(Text Encoding Initiative)ガイドラインによるテキストデータ構築の入門書。日本語文化圏初のハンドブック。TEIガイドラインを詳しく知るための概説編、実際にテキストデータ構築をおこなうための実践編、TEIガイドラインを用いてテキスト構築に取り組んでいる事例を紹介する事例編からなる。
渋沢栄一記念財団が人文情報学の研究者とともに、令和2(2020)年度国立歴史民俗博物館総合資料学奨励研究「TEIを用いた『渋沢栄一伝記資料』テキストデータの再構築と活用」において取り組んだ、『渋沢栄一伝記資料』別巻第1, 第2のテキストデータの構造化と「渋沢栄一ダイアリー」の公開について、事例編で紹介している。
書影
目次
項目 | ページ |
---|---|
目次 | 3 |
はじめに:人文学のためのテキストデータ構築 / 永崎研宣 | 8 |
第1部 概説編 | [11] |
第1章 人文学のためのテキストデータの構築とは / 永崎研宣 | 12 |
第2章 日本におけるテキストデータ構築の歴史 / 永崎研宣 | 34 |
TEI活用の事例紹介(1) BNC(British National Corpus)- 言語コーパス / 永崎研宣 | 47 |
COLUMN 1 TEIガイドラインで自分の資料を作り始めるには / 永崎研宣 | 48 |
TEI活用の事例紹介(2) The Folger Shakespeare - 戯曲の構造的記述 / 永崎研宣 | 54 |
第2部 実践編 | [55] |
第1章 Transkribusによる手書きテキスト資料の自動翻刻 / 宮川創 | 56 |
第2章 Transkribus実践レポート:100年分のフランス語議事録翻刻プロジェクト / 小風綾乃 | 110 |
第3章 TEIガイドラインとは / 永崎研宣 | 128 |
TEI活用の事例紹介(3) TEI by Example - 学習ツール / 永崎研宣 | 137 |
第4章 実践演習:漱石書簡を用いたTEIによるテキスト構造化入門 / James Cummings原作, 永崎研宣翻案 | 138 |
TEI活用の事例紹介(4) FAUST EDITION - 学術編集版 / 永崎研宣 | 142 |
第5章 利活用演習:TEI準拠テキストの活用方法 / 永崎研宣 | 180 |
COLUMN 2 TEI協会 東アジア/日本語分科会の活動 / 永崎研宣 | 199 |
TEI活用の事例紹介(5) Cambridge Digital Library - 詳細な書誌情報と版面画像から全文テキストまで / 永崎研宣 | 204 |
第3部 事例編:テキストデータ構築の最新事情(1) | [205] |
第1章 日本古辞書のTEI符号化 / 岡田一祐 | 206 |
TEI活用の事例紹介(6) Vincent van Gogh The Letters - 書簡のマークアップ / 永崎研宣 | 241 |
第2章 TEIを用いた『渋沢栄一伝記資料』テキストデータの再構築:「渋沢栄一ダイアリー」公開まで / 金甫榮, 井上さやか | 242 |
第3章 TEIとRDFを用いた財務史料の構造化:古代日本・近世スペイン・近代イギリスを事例に / 小風尚樹 | 260 |
第4章 TEIデータの可視化方法と事例紹介 / 中村覚 | 282 |
第5章 Transkribusを用いたTEIの人名タグ付きテキストの機械学習による自動人名抽出:ジャアファル・ブン・イドリース・カッターニー『目録』を例に / 石田友梨 | 302 |
COLUMN 3 TEIにおけるセマンティック記述と<standOff> / 小川潤 | 309 |
第4部 事例編:テキストデータ構築の最新事情(2) | [315] |
第1章 大正新修大蔵経TEI化に関する概略 / 渡邉要一郎 | 316 |
第2章 日本仏教における研究成果のマークアップ:日本天台の文献研究に着目して / 矢島正豊 | 349 |
第3章 禅籍の構造とTEIマークアップ:T2591義雲和尚語録を例として / 佐久間祐惟 | 354 |
第4章 大正新修大蔵経テキストのTEI構造化における「私的パラグラフ」の設定 / 井野雅文 | 362 |
第5章 『續一切経音義』を通じた外字と割注の課題 / 王一凡 | 368 |
第6章 知識グラフを表現する:『愚禿鈔』のマークアップを例として / 左藤仁宏 | 379 |
第7章 大正新脩大蔵経TEI化作業の中国古典籍への援用 / 片倉峻平 | 393 |
COLUMN 4 著作権法改正で Google Booksのような検索サイトを作れるようになる? / 南亮一 | 400 |
あとがき / 永崎研宣, 大向一輝 | 409 |
用語タグ索引 | 412 |
XMLタグ索引 | 414 |
用語解説 | 416 |
編者&執筆者一覧 | 419 |
関連エントリー
- [センターニュース][栄一情報] 「渋沢栄一ダイアリー」公開。渋沢栄一の日常を覗いてみよう!
https://tobira.hatenadiary.jp/entry/20210423/1619161341 - [センターニュース][栄一情報] 「渋沢栄一ダイアリー」に機能が追加されました
https://tobira.hatenadiary.jp/entry/20220603/1654243836
参考リンク
- 渋沢栄一ダイアリー
https://shibusawa-dlab.github.io/app1/ - 一般財団法人人文情報学研究所(監修)石田友梨/大向一輝/小風綾乃/永崎研宣/宮川 創/渡邉要一郞(編)『人文学のためのテキストデータ構築入門 TEIガイドラインに準拠した取り組みにむけて』(文学通信)
〔文学通信〕
https://bungaku-report.com/books/ISBN978-4-909658-84-5.html - 『人文学のためのテキストデータ構築入門 TEIガイドラインに準拠した取り組みにむけて』より「第1章 人文学のためのテキストデータの構築とは(永崎研宣)」を公開
〔文学通信 - 2022年7月29日〕
https://bungaku-report.com/blog/2022/07/tei1.html - 人文学のためのテキストデータ構築の国際デファクト標準、初の日本語による入門書
〔digitalnagasakiのブログ - 2022年7月31日〕
https://digitalnagasaki.hatenablog.com/entry/2022/07/31/230624