データ交換の標準化を
個別対応の限界と共通規約の必要性
本文
今まで、健康診断のデータを交換するのに決まった手段、方法が無くずいぶん不便を強いられてきました。受診者が一人であれば、印刷された結果表を見ても何とかなるのですが、多人数になるともういけません。その結果、せっかくのデータが個々の施設でばらばらに保管され、健康診断のデータの有効利用を図る上での障害になってきました。
これを何とかして、電子媒体によるデータ交換を、という考え方は従来からありました。政府管掌健保の健康診断やいくつかの健康保険組合では、受診者のデータをフロッピーで入稿するようになっています。しかし、現実には健康保険組合側の恣意的判断により媒体への記録様式を細かく規定したものであり、ずいぶんと不自由を強いられてきました。例えCSVファイルであってもデータの形式と順番はばらばらなので、個別対応を強いられるのです。中には最初の何バイトは受診者のID、次の区切り記号は何、次の何バイトは氏名、文字コードはJIS、…といった具合に全部固定長で指定するところもあるくらいです。
また、システムのバージョンアップの際にも標準化されたデータ交換の様式が無いために苦労を強いられてきました。A社のシステムからB社のものに乗り換える時に、たとえデータ構造が公開されていたとしても、データ構造が異なるために移植作業に膨大な労力が必要となり、結果的に高いものについていました。
このような状態を解消するために、データ交換についての規約を作っておこうと考えるのは自然の成り行きです。このような規約に求められる条件としては、
- 特定のメディア(光磁気ディスク、ICカード、光カードなど)や、それらの物理的あるいは論理的構造(データフォーマットなど)、データ転送方式(TCP/IPなど)、あるいはデータ処理システム(リレーショナルデータベースなど)などに依存しない。
- その代わり、健康情報システム間で授受されるデータの記述法はしっかり規定されている。つまり、送信側のデータを受信側システムが解釈するために必要な情報(データ項目名、データ値、標準値、データ型など)の記述法を規定しておく。
- データはASCII形式の可読(readable)テキストで記述しておく。これによりデータ作成やコード変換などを容易にできる。
といったものがあります。
このような条件を満たすものとして、Markup Languageを用いた標準化が考えられます。電子カルテのデータ交換に利用できるものとしてはMML(Medical Markup Language)が策定されていますが、より健康診断のデータに特化したものとして、HDML(Health Data Markup Language)*1があります。これらはSGML(Standard Generalized Markup Language)に属するもので、本来あらゆる種類の文書を記述することができる柔軟性があります。HTMLと良く似たものであり、HTMLの柔軟性を考えれば、これらの言語仕様の柔軟性は分かると思います。
このような仕様ですと、機種やデータベース構造に依存しないため、個々ばらばらのシステムに対応させるための膨大な作業から解放され、既存のシステムや独自のシステムを安心して利用できますので、筆者としては大いにこの方向で標準化が進むことを期待しておりました。しかし、健診システムでHDMLに対応しているところは私の知る限りでは一社のみでした。普及が進まない原因として、SGMLパーサーやXMLパーサーの開発が面倒、個々の健保の要求するCSV形式に都度対応した方がプログラムが楽、という声を聞きます。
ですが、データ構造が異なる個々の要求に対応していくのは健診施設としては限界があり、いつまでも現状のままで居て欲しくはないところです。もしSGMLやXMLが使いにくいのならば、それに代わる健診データ交換規約を考えなくてはなりません。
なお、本稿の執筆に当たっては、日本総合健診医学会第29回大会の抄録集より、文部省(当時)大学共同利用機関 国文学研究資料館 助教授 原 正一郎先生の一文を参考にさせていただきました。ここに謝意を表します。