Last updated on August 29, 2000.
NOTE:
使用する毎日新聞記事データは94, 95, 98年のものとします.参加者は各自新
聞社と覚書を交わし,データを入手して下さい.
なお,dryrunでは94, 95年のみを使用します.
各参加者は,IREX提供のmai2sgml.plを用いて,対象テキストを変換したIREX IRタ
スク用のデータを用いる.変換後のデータに付与されている情報は,参加者の自由
意志によって,どのようにも使用可能である.ただし,変換前のオリジナルのデー
タにのみ含まれているキーワード等の情報は使用してはいけない.
[詳しくはTask descriptionの3
節を御覧下さい]
「重要文抽出型要約」(課題A-1)の参加者は,上記mai2sgml.plの出力に,
tscsgml.plを適用したデータを用いる.それ以外の課題の参加者のtscsgml.plの使
用は自由意志とする.
[詳しくはTask descriptionの3
節を御覧下さい]
なお,タスクA-1の参加者には,TSCから要約対象となる記事をリストした DOCIDS_FILEを配布します. -L オプション,-D オプションでご利用下 さい.