[ 費用:1000 NTD ]

資料庫名稱:北科大教育電台廣播節目語音語料庫(NER-TRS-VOL1-4)

北科大教育電台廣播節目語音語料庫(NER-TRS-VOL1-4),為台北科技大學廖元甫教授,轉寫國立教育電臺近年節目音檔,產生節目語音檔逐字稿,並做人工校正與人工切割成長度約30秒的音檔後,將總共約600小時語料,分成四個子集,以非營利使用授權方式發行語料庫。

語料庫包含:

                | Train(小時)  |  Validation(小時)  |   Test(小時) |   Total(小時)

NER-TRS-VOL1 |   127.4  |      12.9  |    13.5   |    153.8

NER-TRS-VOL2 |   112.7  |      11.6  |    10.2   |    134.5

NER-TRS-VOL3 |   135.7  |      18.4  |    18.6   |    172.7

NER-TRS-VOL4 |   130.8  |       8  |     10   |    148.8

語料總計    |   506.6  |     50.9  |    52.3   |    609.8

  • 本語料庫已經由臺北科技大學授權社團法人中華民國計算語言學學會發行,申請人需簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。
  • 由服務單位開立身份證明書,學術研究單位者申請內文需言明所申請之「北科大教育電台廣播節目語音語料庫(NER-TRS-VOL1-4)」確實僅用於研究,不作商業用途。
  • 預申請本資料集,請備妥下述申請文件:

  • 由服務單位開立身份證明書(http://www.aclclp.org.tw/doc/id.doc),學術研究單位者申請內文需言明所申請之「北科大教育電台廣播節目語音語料庫(NER-TRS-VOL1-4)」確實僅用於研究,不作商業用途。
  • 授權使用協議書(一式兩份):(下載 http://www.aclclp.org.tw/doc/ner_trs.pdf )
  • 11529 台北市研究院路二段128號中研院資訊所(轉)

    中華民國計算語言學學會 收

  • 其他詳細申請文件及費用說明請參考學會網址: http://www.aclclp.org.tw/use_mat_c.php#ner
  • 學會成立二十多年來主要宗旨一直在於推動計算語言學之研究、推行計算語言學之應用與發展、促進國內外中文計算語言學之研究與發展與聯繫國際有關組織並推動學術交流。每年舉辦的ROCLING年會是計算語言學學術界與業界發表與交流成果的盛會。本學會也定期舉辦計算語言學相關的工作坊及研習營以提高年輕研究人員對計算語言學的興趣與訓練。