What is SGML and why
(英文)の邦訳です。
SGMLとは? どうやって使うのか?
もくじ
SGML (Standard Generalized Markup Language) とは、
情報の表現のための国際標準である。
SGML は「出版」とつくものならどんなものにでも適応できる。
たとえば、従来の単一媒体の紙による出版はもちろん、
オンラインマルチメディアデータベースまで対応できる。
SGMLを使って人間が読めるようなファイルを作ることもできるし、
容易な機械・アプリケーション間での相互交換も可能である。
このチラシでは、専門用語を使わずにSGMLの主な特徴をの概要を紹介する。
SGMLは、国際的に認知され、非独占で
自由なマークアップ方式を提供する。
マークアップとは、ファイルの有効なデータ部分に追加される文字であり、
データについての特定の情報を伝えるものである。
例えば、ワードプロセッサのマークアップとは、
ワープロソフトが文書ファイルの中に挿入する制御コードのことで、
文字のフォント、センタリング、改ページなどを指示するようなものである。
データベースシステムにおいては、フィールドの境界を表す内部コードが使われる。
SGMLは、ファイル中のデータについての性質、機能や内容をあらわす
説明的マークアップ に立脚している。
データをどう処理するか、を示しているわけではない。
(訳注:Netscape extensionは処理方式を指示している点で「説明的」でない。)
SGMLは、文法よりも意味を表現するのに使われる。
SGMLを使うことにより、表題は「20ポイントTimesBoldで印刷される文字の羅列」
ではなく、「表題」として認識される。
SGMLは厳密である。
SGMLを使ったマークアップを使うことにより、
正しいデータの構造とするためにはどのようなマーク付けを行なえばよいか、
を厳密かつあいまいさなしに宣言することができる。
既知の方法で データが構造化されていることが保証されていれば、
SGML対応のソフトウェアはファイルに含まれているマークアップが
その方式に従っていると判断することができる。
たとえば、あなたの使っている方式で「sub-sectionはsectionとつけられた
段落の中でしか使えない」と宣言されていれば、SGML対応ソフトウェアは
この法則が文書の生成・修正でも適応されていると判断する。
あなたに厳密かつ公開されている方法で構造化されたデータを
含んでいるファイルが渡されたとしよう。
このデータは、あなたが使いやすいと思う方法で使うことができる。
紙にきれいに印刷することもできるし、オンラインでながめてもいい。
データベースから参照して文書アーカイブを作ることもできるし、
逆にデータベースの資料を参照して動的な文書を作ることもできる。
複数のファイルから内容を抜き出してきて組合せ、新たな文章も作れる。
ファイルをハイパーテキストやマルチメディアシステムに組み込むことも可能だ。
いろいろなことが、もとのファイルを 一切変更せずに
実現できる。同時に同じ情報を違った方法で処理することができるのだ!
SGMLを使えば、情報の 再利用 と 共有 が可能だ。
違ったサイト、違ったエディタを違ったマシンで使っていても、
SGMLを使えば簡単に一つの文書にまとめることができる。
その文書が従っているマークアップ方式さえわかれば、
どんなSGMLファイルを持ってきても思いどうりに加工することができる。
したがって、複数のサイトがアーカイブから文書を落してきて、
「ウチの方法」で印刷するようなことができる。
SGMLを使えば、あなたの仕事に対する 考え方 が変わるだろう。
今までやってきたことの簡略化や、やってみたいとずっと思っていたことを
可能にしてくれるだろう。
新しい文書を作るにも、いちいちワープロのファイル、ヘルプ、
データベースのファイル、ハイパーテキストなどと分けず、
ファイルを精密に構造化された情報の入れものだと考えるようになるだろう。
あなたの関心はファイルの内容と、適切なマークアップを付けていくことに
なる。うまく処理されるだろうかと気をもむ必要はなくなるのだ。
SGMLでは、ファイルは 一貫した 方法で処理される。
印刷文書に「ウチの方法」を適応するには、
SGMLをたとえばLaTeXコマンドやワープロの形式に変換する
変換器を用意して、
すべてのファイルがこの変換器を通るようにしておけばよい。
変換器は一つ書くだけでよい。
「ウチの方法」が変わったら、変換器を書き換えるだけでよい。
新しい変換器にて古いファイルを通してやれば、装いも新たになる。
古いファイルをいじる必要は一切ない…もともと書式に関する指示は
一切入っていなかったのだから!
もう一つ覚えておこう。
印刷に使ったものとまったく同じファイルをオンラインの(ハイパー)文書にも
データベースから参照するのにも使える。
Elsevier, Springer-Verlag, Kluwer, Oxford University Press といった
科学・参考図書出版社。
国際標準化機構(ISO)、HMSO、ヨーロッパ特許局、ヨーロッパ共同体、
アメリカ国防省といった、大量の文書を扱う所。
UNIXのハード・ソフトを扱うおもな会社は、
次世代の紙および"man"ページのドキュメントを
SGMLで配布することを選択している。
Oxford English Dictionary の最新版はSGMLであり、紙とCDROM両方で入手できる。
教育方面では、Text Encoding Initiative (メジャーな国際プロジェクト)
が学術解析に使われる電子文書の交換にSGMLを推奨している。
アメリカ化学学会、アメリカ数学会
では、すべての電子出版にSGMLを使う予定である。
CERN および Institute of Physics の出版部門もSGMLを採用した。
特定のコードを含まないようなエディタ(plain ASCII や EBCDIC) であれば
どんなものでもSGML文書の作成が可能だ。
寄せられているSGML関係のソフトウェアはほとんどすべてのプラットフォームや
環境に対応している。また、主な機械やOS (PC, Mac, UNIXなど) で動く
高品質な市販のソフトも入手可能だ。
SGMLプロジェクトはUFCの情報システム委員会(Information Systems Committee)の
資金で運営されており、SGMLについてのくわしい情報の提供や使用法、
関係するソフトウェアについての助言を行なっている。
また、認可された学術・研究機関には 無料で レクチャー、
セミナーやワークショップのプログラムを提供している。
また、パブリックドメインソフトウェアの電子アーカイブや、
オンラインの Mailbase ディスカッションリストの運営も行なっている。
- 連絡先:
- The SGML Project
- c/o Univ. of Exeter IT Services
- Laver Building
- North Park Road
- Exeter EX4 4QE
- Tel: 0392-263946
- Fax: 0392-211630
- Email: sgml@exeter.ac.uk
sgml@exeter
訳者:
かべ@dais.is.tohoku.ac.jp