デジタルアーカイブ・Linked Open Data / RDFソリューション

デジタルアーカイブ・機関リポジトリ・オープンデータの公開ならInfoLib

ホーム特長製品紹介導入事例活用シーン保守サービスFAQ

FAQ

第3回 『創造資源としてのデジタル資料』

目次
1 認識と事実 5 国際標準と国内モデル
2 資料とは何か 6 創造のコスモスへ
3 発見と新たな視座 連載【デジタルアーカイブ羅針盤】を終えて
4 メタデータとプロトコル

1 認識と事実

「歴史認識という言葉がありますが、これは要注意です。加害者と被害者が同じ歴史認識を共有できるわけがありません。しかし、歴史事実は共有できる。アーカイブの意味と価値は、そこにある」と語ったのは、国立公文書館アジア歴史資料センター長などの要職を歴任され、今年2月に亡くなられた石井米雄氏(1929〜2010)であった。
靖国参拝問題などのニュースで“歴史認識”という言葉が2006年頃から頻繁に言われていた時のこと。“認識”とは、物事を見定め、その意味を理解することだが、物事をどのように見定め、どのように意味を理解するかは、それを受け止める個人の精神的機能である知性に委ねられる。この曖昧さに気付かされた言葉だった。人は考える葦(あし)であるとパスカルは言ったが、自戒を込めて言えば自分勝手に自己都合で考える生き物でもあるから、牽強付会(けんきょうふかい)は要注意である。
しかし、事実としての“資料”を考えることの手掛かりや足掛かりにして、一歩一歩前進させて行けば、深い森に迷うことはあっても、いつか光の射し込む出口を見つけ、目的の地に到達できるのではないか。考えるための材料である資料という分野に、デジタルアーカイブという概念が生まれ、デジタル資料が加わり、共有できる資料の数量と役割は格段に増殖している。一次資料といわれるオリジナルに対し、二次資料といわれるデジタルアーカイブ。この“資料”という言葉に二次資料の新たな利用価値が隠されているようだ。信頼できる資料は、限られた人だけのものではなくなり、求める人に開かれている。

2 資料とは何か

まず“資料”を広辞苑で調べてみると、「@ もとになる材料。特に、研究・判断などの基礎とする材料。A 試行Aの結果。または結果を数量で表したもの。」とあり、試行Aとは「同一または同一とみなされる条件で何回も繰り返すことができ、結果が偶然的な、実験・観察・調査をいう。偶然的試行。確率的試行。」とある。
資料を有する一般的な施設であるミュージアム(美術館・博物館)やライブラリー(図書館)やアーカイブズ(文書館)は、文化的・教育的な資料を収集・保存・公開する類縁機関として、その頭文字を取ってMLAと呼ぶ。ミュージアムは収集・研究・展示、ライブラリーは分類・閲覧・レファレンスサービス、アーカイブズは保管・公開、というように各施設の業務の力点は異なっているが、MLAが有する資料の総体によってわが国の知的・美的資源が形成され、知と美を支えている。このMLAの所蔵する資料(史料*1)には、「実物」「標本」「絵画」「彫刻」「写真」「映像」「音楽」「書籍」「雑誌」「文書」「貴重書」「マイクロフィルム」「映画フィルム」などがあり、メディアもさまざまある。またMLAのデジタル資料は、施設内に設置された独立型の機器にデータを構築した「スタンドアロン型データベース」、パッケージ化された「CD-R」「DVD」や、インターネット上に公開している「Webサイト」「ブログ」といった情報の形態で目にすることができる。近年MLAの各資料をデジタル化し、施設が所有する資料をインターネットを通して閲覧することが徐々に実現してきているが、2010年7月現在まだ日本のMLAの横断的閲覧は達成されていない。
しかし、そんな現状にあってiPadやKindleなどの電子書籍端末機や携帯電話の人気、グーグルブックスやデジタル教科書の急増、国立国会図書館の所蔵資料のデジタル化に資する127億円の事業支出や公的機関の「インターネット情報収集」などを見ると、資料のデジタル化は、スピードを増すことが予測できる。

*1: 歴史の研究または編纂に必要な文献・遺物。文書・日記・記録・金石文・伝承・建築・絵画・彫刻など。文字に書かれたものを「史料」、それ以外を広く含めて「資料」と表記することもある。

3 発見と新たな視座

インターネットの普及によってデジタル資料へのアクセスが容易になってきた反面、オリジナルへのアクセスが減ったという声を聞く。オリジナルの保存と公開のバランスは、デジタル資料が製作される以前からの変わらぬ永遠の課題であるが、今までは収蔵庫などに保管され、全く見ることができなかった貴重なオリジナルがデジタル資料によって、いつでもどこでも見られる環境になったことは歓迎すべき大きな変化であろう。オリジナルへのアクセス頻度が減ることで、オリジナルの劣化速度を遅くするという利点がある。
オリジナルとデジタル資料の関係で、二次資料であるデジタル資料の画像については、オリジナルよりも価値が低いという見方がある。しかしオリジナルのある一部分や肉眼で見えないところなども拡大して見ることや重ね合わせて比較して見ることなどができ、オリジナルに対しての発見や新たな視座を与えてくれ、またオリジナルが消滅した場合には貴重な記録資料となり、自立して行く。もう一つは、絵画における、オリジナルの唯一性の見方である。例えば、オリジナルのゴッホの油絵が1点あったとする。この作品は制作時のままに維持されているわけではない。画材の経年変化や作品を保存するという過程で行われる洗浄、歴代の修復家による人的行為が施されており、作品に変化を加えている。厳密に言えば、修復後の変化した作品を私たちはオリジナルと言っているのだ。
ここで大事なのは、修復や画像製作時の履歴が追えるように、組織や記録方法をシステム化しておくことだ。刻々と変化しているオリジナルにおいて、その変遷をたどることのできるデジタル資料のメタデータが重要視される理由はここにある。オリジナルを基にして生まれたデジタル資料は、メタデータを付随させてオリジナルとデジタル資料の関係などを記録することにより、真正性・保全性・信頼性を伴った新たな価値を生み、オリジナルを強化する。ボーンデジタルでも同様に、メタデータは重要である。

4 メタデータとプロトコル

デジタルアーカイブの対象は、有形・無形を問わず、森羅万象である。デジタル記録されたすべてがデジタルアーカイブであり、デジタル資料となるが、その網羅的なデジタル資料は、物理的な制限を受けず、平等にネットワーク上に発信されてさらに価値を増す。そこで重要となるのがやはりメタデータ、そしてプロトコル(データ通信を行うために定められた規約)である。
メタデータは、「データに関するデータ(Data about Data)」といわれる。多様に存在するメタデータを大きく分けると、資料の検索に用いる「記述メタデータ(Descriptive Metadata)」と、資料の保存などに用いる「管理メタデータ(Administrative Metadata)」に区分することができる。
「記述メタデータ」は、デジタル資料の内容に関する記述であり、デジタル資料を探し出すために利用されることが主であり、「管理メタデータ」は、デジタル資料の保存やアクセス制御など管理方法に関するメタデータである。このほか、デジタル資料の物理的・論理的内部構造に関する「構造メタデータ(Structural Metadata)」や、デジタル資料の利用に必要な技術的要件に関する「技術メタデータ(Technical Metadata)」などある。これまで資料を検索、発見する「記述メタデータ」が注目されていたが、近年はデジタル資料を後世に残すという観点から「管理メタデータ」の重要性も認識されてきている。
宇宙データシステム諮問委員会(CCSDS:Consultative Committee for Space Data Systems)の開発した「OAIS(Reference Model for an Open Archival Information System)参照モデル」は、デジタル情報の長期保存システム構築に関する国際標準に認定された指針である。「管理メタデータ」に属する「保存メタデータ」の概念が打ち出されており、保存対象となるデータを関連するメタデータと組み合わせた情報パッケージを単位として、併せて保存のために用いられる記述情報を4つのカテゴリー(内容情報の由来を示す「来歴」・他の情報との関係を示す「コンテキスト」・内容情報を同定するためのID情報である「参照」・内容情報が変更されていないことを示す「不変性」)に分けたモデルを提示した。これをOCLC(Online Computer Library Center,Inc.)とRLG(Research Libraries Group)が進化させ、実用化へのガイドラインを策定するワーキンググループ「PREMIS(Preservation Metadata:Implementation Strategies)」を立ち上げ、思考の手掛かりを示している。メタデータはデジタル資料のクオリティを左右する。
他方プロトコルであるが、この規約はデジタル資料どうしを結び付けるもので、アナログ資料にはなかったデジタル資料特有のものである。インターネット通信に関する規約を定めた横断検索プロトコルZ39.50やSRU/SRW(Search/Retrieve via URL/Search/Retrieve Web Service)などによって、関連事項を自動的に探し、瞬時につなげて表示しくれる。プロトコルは連想を誘発させ、創造を導いてくれる。
メタデータとプロトコルの具体例として、「Second Life」に見られるようなバーチャル世界をデジタル資料が構成し、インターネット内ルールとして現実とは異なる仕組みや価値観をも生成してきている。著作権の枠組みや流通を新たに切開く「クリエイティブ・コモンズ」などはその一例であり、写真共有サイト「Flickr」は、「クリエイティブ・コモンズ」を採用している創造資源である。
フォーマット変換などにより新しい環境に移行していくマイグレーションにせよ、新しい環境の中に古い環境を再現しようとするエミュレーションにせよ、デジタル資料には、誰が、いつ、デジタル資料を製作したかを証明する電子署名やタイムスタンプ(時刻印字)による記録、技術変化に伴うハードウェアやソフトウェアの消失に備えたメーカー名やバージョンの記述が大切である。デジタル資料を残すという意識や、あるいはモチベーションがなければデジタルアーカイブを業務のルーチンワークに組み入れても良いだろう。

5 国際標準と国内モデル

メタデータの記述方式は、デジタル資料の対象物や業種などによって多種あるが、MLAに関連したメタデータ標準化の一例を挙げてみよう。
MLAの区分に関係なく、メタデータ標準化の開発や研究者の支援を行っている国際的な組織である「Dublin Core Metadata Initiative (DCMI) 」 が制定した「ダブリン・コア(Dublin Core Metadata Element Set)」(図参照)という国際規格がある。インターネット上でのデジタル資料の発見を目的とし、領域を超えた機関間のデジタル資料の交換・共有の実現を意図した記述メタデータだ。これには15の基本的なエレメント(項目要素)があり、「Simple Dublin Core」とも呼んでいる。ほかに15のエレメントをさらに拡張して記述する限定子(qualifier)付きダブリン・コア「Qualified Dublin Core」がある。しかし、主にライブラリーでは汎用性のある「Simple Dublin Core」を使用しており、また図書館界では国際図書館連盟(IFLA)が制定した「ISBD[G](General International Standard Bibliographic Description)」という国際標準書誌記述一般原則や、「ISBDの統合版〔草案〕」、「MARC(Machine Readable Cataloging)」がある。
ミュージアム(博物館界)では、2005年にわが国で発表された東京国立博物館の「ミュージアム資料情報構造化モデル」がトピックであろう。国際的には、国際博物館会議(ICOM)が制定した統一的記述「IGMOI(International Guidelines for Museum Object Information)」やドメインオントロジー(ミュージアムで使われる概念と、その概念の属性や概念同士の関係、 さらにそれらの関係に対する制約で構成される)を用いた概念構造の記述「CIDOC CRM(Committee for Documentation Conceptual Reference Model)」がある。また、英国博物館ドキュメンテーション協会(MDA:Museum Documentation Association)の「SPECTRUM」と「MDAデータ標準」や、米国スミソニアン協会所属のAmerican Art Museumが使用しているGallery Systems社の収蔵品管理システム「The Museum System」、米国ゲッティー財団によるAITF(The Art Information Task Force)制作の美術作品記述カテゴリー「CDWA(Categories for the Description of Works of Art)」、また視覚資源分野で指導力を提供しているVRA(The Visual Resources Association)の「VRA Core」、博物館間での情報共有を進めるCIMI (Consortium for the Computer Interchange of Museum Information)の「 CIMI Profile」、カナダ文化財情報ネットワークの「CHIN(The Canadian Heritage Information Network)」などがあり、わが国独自の構造化モデルとともに、海外の事例がメタデータ構築時の参考になる。
アーカイブズ(文書館界)では、国際文書館評議会(ICA)の国際標準記録史料記述一般原則「ISAD [G](General International Standard Archival Description)」や、米国アーキビスト協会(SAA)などが提示した「EAD(Encoded Archival Description)」がある。
さらにインターネットの電子世界では、横断的にMLAが所有するデジタル資料の統合的な利用が進められており、W3C(World Wide Web Consortium)の下では、メタデータの基本概念がRDF(Resource Description Framework)として確立され、ダブリン・コアは、このRDFのフレームワークに、独自の意味や構造を持ったマークアップ言語を作成することができるXML(Extensible Markup Language)で記述している。業務の効率化と情報の共有のために、メタデータは国内事例や国際標準(ISO)を見渡し、所属するコミュニティーが使用する安定した用語に従って記述するのが望ましいと思われる。

6 創造のコスモスへ

IT企業の技術や製品に依存することが多いデジタル資料は、2010年では不完全な危うい資料と言わざるを得ない。電気が必要であり、データを再現する機器やソフトウェアもなければならないのだ。このマシンリーダブルの制約と限界を熟知し、乗り越えようと努力する過程で、デジタル文明の秩序と調和のとれたコスモスが形成されて行くのだろう。
デジタル資料が、人の手を離れ自動的に猛スピードで蓄積されている実感のない不安定な資源から、感動を生み出していく実感のある創造資源へ。デジタル資料から創造の遺伝子を受け継ぎ、新たなオリジナル資料を作ることで発信するという能動態へシフトすることが、サステイナブルな創造社会となるだろう。
葛飾北斎の描いた「北斎漫画」のパーツを活用してオリジナルの物語を作る「北斎漫画制作キット」や、ユーザーの手による多彩な創作物が製作されている人工歌姫「初音ミク」は刺激的なクリエイティブコンテンツである。そこでさらなる創造社会を目指して、デジタル資料の相互運用性を前提としたガイドブック「デジタル資料の作り方・使い方・事例集」を作ってみてはどうだろうか。人文情報学や文化情報学、文化資源学などの専門的な学問領域、電子書籍やデジタルサイネージ(電子看板)などのコンテンツビジネスの領域など、多分野から思いもよらぬデジタル資料の活用法が出てくる可能性がある。デジタル資料を情報の大海からすくい出し、適材適所にデジタル資料をつなぐためのハンドブックは、デジタルアーカイブの事例を総覧でき、有用となるだろう。
具体的には、2005年に作成された国立国会図書館の「国立国会図書館 資料デジタル化の手引き」や、国立公文書館が2009年に作成した「デジタルアーカイブ・システム標準仕様書」にデータベースの構築法や検索方法、見読性、セキュリティ対策や、データの保存管理を含めた一定の基準が示されており参考となる。資料をデジタル化し、インターネット上で提供するだけではなく、3DやAR(Augmented Reality/拡張現実)といったリアルとバーチャルの境界に立つ教育や、ビジネス利用での促進や評価、新しい情報技術との組み合わせによる新分野の開拓といったアクションが新たなコミュニケーションを生むにちがいない。文化と経済をつなぐ創造資源として、創造の円環運動を期待したい。デジタルアーカイブの歴史は始まったばかりで、二次資料としてのデジタル資料の有効な利活用法、使い方は案外知られていない。
デジタルアーカイブによって生まれたデジタル資料は、調和が形成される以前の未分化の状態にある。この混沌としたカオス状態から創造のコスモスへ。デジタル資料の本格的な活用が始まった今こそ、将来を展望した具体的な熱い議論が求められているのだと思う。

参考文献

日本図書館協会目録委員会編『電子資料の組織化 日本目録規則(NCR)1987年版改訂版第9章改訂とメタデータ』2000.5.31,日本図書館協会
杉本重雄『電子図書館 −概要と課題−』2003.1(http://www.tulips.tsukuba.ac.jp/pub/dlsympo/tutorial.pdf)2010.7.20
栗山正光『OAIS参照モデルと保存メタデータ』2004 (http://www.tokiwa.ac.jp/~mtkuri/papers/oais_rm_and_metadata.pdf)2010.7.20
杉本重雄『XMLとメタデータ − メタデータの基本概念』2005.7 (http://avalon.slis.tsukuba.ac.jp/~sugimoto/Articles/XML_Metadata.pdf) 2010.7.20
谷口祥一『ネットワーク時代の図書館情報学 メタデータの〔現在〕――情報組織化の新たな展開』2010.1.25,勉誠出版

連載【デジタルアーカイブ羅針盤】を終えて

『デジタルアーカイブの歴史』、『デジタルアーカイブの本100冊』、『創造資源としてのデジタル資料』と、過去、現在、未来を想定して3回の連載を終えて振り返ってみると、誕生から15年ほどのデジタルアーカイブを取り巻く環境は、グーグルブックスやTwitterの出現などのほか、本格化した電子書籍の進展力に見られるように、スピード感があり留まるところを知らずに拡張しているように感じる。
2010年4月に国立国会図書館が、「デジタルアーカイブ白書2005」の発行後5年ぶりに本格的な全国規模のデジタルアーカイブ調査を行い、「文化・学術機関におけるデジタルアーカイブ等の運営に関する調査研究」(シィー・ディー・アイ,2010)の成果を発表した。4,302機関のうち調査回答のあった2,076機関の26.6%(553機関)がデジタルアーカイブを実施・運営していた。同様のアンケート調査で行った6年前の「デジタルアーカイブ白書2004」のアンケート調査結果(博物館・美術館:29.4%,大学図書館:37.0%,公共図書館:16.3%,公文書館:20.0%,自治体:46.2%)と比較すると急激な変化は見られず、調査結果は停滞感を表していた。一般社会の急激なデジタル化への移行に比べ、今調査による文化的専門機関の変化のない原因を追究することからデジタルアーカイブの今後は見えてくるのだろう。
多様な価値観に社会が揺れ動いている中でも、何が真実なのか、目標を誤らないよう注意し、前進するためにも自分自身のデジタルアーカイブの海図を書き起こしていかなければならない。デジタルアーカイブを構築する人、運用する人、利用する人それぞれの目的・目標があるだろう。デジタル資料は量とともに質も深まり、歴史は未来へ向かって積み重ねられてゆく。デジタルアーカイブの大海原で、この羅針盤がほんの少しでも役立てば幸いである。

デジタルアーカイブ羅針盤>> コラムリストへ

デジタルアーカイブ(研究家)美術情報 影山幸一

ページTOPへ