39 資料探勘 ( )

再給一考古裡資料探勘之例,也是有關辨識文字。古埃及的歷史悠久,約在西元前 4000 年,就已出現多個城邦國家 (city state) ;目前出土的文物中,有約西元前 3400 年前之象形文字 ( 亦稱聖書體 (Hieroglyph) ,為古埃及的正式書寫體系,其手寫體則稱為僧侶體 (hieratic)) 石板。而埃及的第一王朝,約始於西元前 3150 年,也就是埃及的信史已超過 5 千年。至於舉世聞名的“胡夫金字塔” (Pyramid of Khufu ,位於吉薩 (Giza) ,在開羅 (Cairo) 西南約 20 ) ,此當今唯一倖存的 ( ) “世界七大奇蹟” (Seven Wonders of the World) ,約在西元前 2584 2561 年間興建。這座以今日眼光來看,仍屬鬼斧神工的建築,古埃及人可是在距今約 4600 年前完成。由於實在超乎人的理解,至今仍不時有人一口咬定“金字塔是外星人所建”。不過從西元前 11 至西元 7 世紀,約 1 6 百年間,埃及先後被幾個帝國征服。在西元前 4 世紀下半葉起,希臘與羅馬人的統治時期,古埃及的文明逐漸沒落。到了西元 641 年,埃及更被新興的阿拉伯勢力完全征服,之後便開始阿拉伯化,人民也被迫改信伊斯蘭教 (Islam) 。至 12 世紀,埃及已普遍使用阿拉伯語文 ( 至今仍為埃及的官方語文 ) ,延綿數千年的古埃及文明,遂被阿拉伯文明所取代。而埃及人對其祖先輝煌的歷史,也就幾乎一無所知了。比較一下,中國的信史,始自約 3500 年前的商朝,遠沒有埃及早。不過即使“中國文明是世界唯一未曾中斷的文明”,此說法雖不盡然正確,但 3500 年來,中國就算曾數度被外族入侵甚至征服,但中原民族的主體語文,並未根本改變或消失,且以傳統漢語文寫成的古典文獻,保存至今。

古希臘馬其頓的亞歷山大大帝 ((Alexander the Great ,西元前 356 - 323 ) 過世後,他建立的橫跨歐亞非之大帝國迅速瓦解,被他的幾個部屬瓜分。埃及歸托勒密王朝 (Ptolemaic dynasty ,西元前 305- 西元 30 ) ,由托勒密一世 (Ptolemy I Soter ,西元前 367-282 年,西元前 305-282 年在位 ) 所開創。托勒密王朝的歷任君主,皆為希臘人的後裔,因而一直習於使用希臘語文。雖統治埃及,但王室幾乎都對學習埃及語文毫無興趣。不過官方文件,仍採希臘文與埃及文並存。到了 1 世紀,古埃及的象形文字便不再通行了。基督教的興起,一神論的主張,更迫使埃及人不再興建被羅馬人視為“異教”的神廟。原本建造神廟時,會在牆壁及梁柱等處,刻上象形文字,敘述一些重要事蹟。如今這需求沒有了,於是象形文字漸趨式微,而已存在神廟裡幾千年,無數的象形文字雕刻,遂逐漸形同廢文,只能當成藝術品看待了。現存最後一個標示有日期的神廟上之象形刻文,時間是西元 398 8 24 日。此後便不再有了,因象形文字,刻或寫給誰看呢?約到 5 世紀後,古埃及所留下大量又重要的文件,便再也無人看得懂了。誰能讓那些從 5 世紀起,便被視為藝術品的象形文字,成為有意義的文字呢?

法國學者商博良 ( - 法蘭索瓦商博良, Jean-Francois Champollion 1790-1832) ,在語言方面極具天賦,精通多種文字,且對科普特 (Coptic) 文,特別感興趣,那是西元 1 世紀後,埃及所創造出之文字。在 18 19 世紀初,當時考古學僅在萌芽階段,尚非一能嚴肅看待的科學。“聖經”的“創世紀”裡,有描述一些人類早期的歷史,只是那畢竟是以色列人所記,人類的誕生,真是那樣嗎?古埃及那些看起來神秘無比的象形文字中,是否有關於世界起源的記載,可用來與“聖經”相互印證?令人好奇。這是何以那時對人類世界起源有興趣者,讀了“聖經”後,不少會對古埃及的文化,產生濃厚興趣的原因之一。但由於象形文字無人能識,以致對古埃及的了解,當時幾乎一片空白。 1809 年,商博良 19 歲時,決定投入科普特文的學習,他想藉由科普特文,來通向古埃及文。

1798 5 月,拿破崙 (Napoleon Bonaparte 1769-1821) 率軍出征埃及,與遠征軍隨行之考察團,包含約 175 位各領域的學者,預計進行各項研究。埃及人習於立碑,凡有什麼大事,便立個碑刻上事件經過。古物的挖掘,亦是考察團此行的目的之一。法軍在羅塞塔 (Rosetta ,位於亞歷山大城以東約 65 公里 ) ,發現一塊石碑,其上刻有 3 段文字,乃 3 種可對照的字體:希臘文、古埃及象形文字,及古埃及通俗文 ( 亦稱世俗體 (Demotic) ,由僧侶體演變而成 ) 。此 3 種文字,皆為托勒密王朝時流通的文字。經翻譯希臘文後,得知這是西元前 196 3 27 日,孟斐斯 (Memphis ,位於開羅南方 20 公里處,曾是古埃及的首都 ) 祭司所撰寫的敕令。記述托勒密五世 (Ptolemy V Soter ,西元前 209-181 年,西元前 204-181 年在位 ) 的即位慶典。

此塊在拿破崙時代,已有將近兩千年歷史的石碑,隨即被運至開羅。法國科學家興奮莫名,當下進行文字拓印、素描,及鑄模,且做出多種複製品,並開始研究。他們樂觀地以為,象形文字的解讀,已指日可待。只是並沒那麼容易,還要再經過至少 20 年的艱辛鑽研,才能破解。 1801 年,法軍敗於英軍。英國本要將法國所有的研究成果,以及那塊令他們垂涎不已的石碑都沒收。寧為玉碎不為瓦全,法國學者威脅要毀去一切,包括石碑。最後英國不得不讓步,同意法國可保留研究資料及石碑拓片等,他們只奪走石碑。法國人並沒什麼好抱怨的,因向來弱肉強食,何況一切都沒問埃及人的意見。後來石碑便以發現地,命名為羅塞塔石碑 (Rosetta Stone) ,今日在大英博物館展示。

古埃及人以莎草紙 (papyrus ,以紙莎草 (apyrus sedge) 的莖製成 ) 來書寫,這種文書便稱為“紙草文書”。古埃及人遺留下大量的“紙草文書”,沙漠地區乾燥的氣候,讓文書能長期保存良好,但至 19 世紀初,已長達 1 千多年無人能辨識。商博良從 1822 1824 年間,全心全力投入羅塞塔石碑上象形文字的研究。他熟悉希臘文,持續相互比對羅塞塔石碑上的 3 種字體,並運用他的科普特文知識,終於逐漸能了解某些古埃及通俗文字之意義。此外,他閱讀無數“紙草文書”,加上不斷推測,有如在解密碼。 1822 年,他成功地譯解出古埃及象形文字的結構,並編出完整的埃及文字符號和希臘字母的對照表。長達 3 千年,無數古埃及的歷史文獻,終於可一一解開了。

1824 6 月,商博良經阿爾卑斯山 (Alps) ,前往義大利北部杜林 (Turin) ,那裡有大量古埃及象形文字文獻的收藏。他找到一份莎草紙文書,那是拉美西斯二世 (Ramesses II ,約西元前 1303-1213 年,約西元前 1279-1213 年在位 ) 時製的。由於其上列有在拉美西斯二世之前,歷代法老的名字,後來便以發現地,將此份文書命名為“杜林國王名冊” (Turin King List) 。雖有若干脫漏,但在拉美西斯二世以前, 3 百多位埃及統治者的名字,及各自在位的時期,仍大致知道了。此對了解古埃及史,助益極大。對商博良的研究過程有興趣者,不妨去看“破解古埃及” (The Keys of Egypt: The Race to Read Hieroglyphs 2001 ,萊斯利亞京斯與羅伊亞京斯 (Lesley Adkins and Roy Adkins) 著,黃中憲 (2007) 為中譯本 ) 一書。

不要說探勘不見得必有所獲,人們常說大數據,但有了大數據,一切就能迎刃而解嗎?對“殷墟”出土的那約 10 萬片的甲骨,雖文字的演變多少有些脈絡可尋,但已確認的 5 千多個相異字中,能辨識的也不過 1 7 百多字,才佔約 1/3 。其他約 2/3 就束手無策了。古埃及人留下不可計數之“紙草文書”,大數據在那裡。但經反覆比對,就能撥開謎網,讀懂古埃及文了嗎?事實上, 19 世紀初,英法等國同時有多人致力於破解工作,只是進展一直很有限。直到羅塞塔石碑出土,而將閱讀古埃及文,視為一生懸命的語言天才商博良,看出如何利用此石碑,辨識古埃及文,終於得以破解。所以,並非任誰有了大數據,便有了解密鑰匙,無往不利。其他像人工智慧 (Artificial intelligence ,縮寫 AI) 也是一樣。眾所皆知,獲年度總冠軍,為 NBA 各隊最高目標,但付出天價年薪,聚集幾個頂尖球員,得總冠軍便能如探囊取物嗎?顯然不一定。同樣地,也非利用電腦,便能有支智慧棒,指揮一切。自己須先有智慧才行。

因覺身上某部位不太對勁,到醫院看診後,醫生指示做影像檢查,諸如照 X 光、超音波、電腦斷層掃描 (Computed Tomography ,縮寫 CT) 、核磁共振造影 (Magnetic Resonance Imaging ,縮寫 MRI) 、正子斷層造影 (Positron Emission Tomography ,縮寫 PET) 等。得到一些影像後,要有專人判讀,了解病因,以對症治療。影像判讀會有失誤嗎?在資料眾多下,或許難免吧!利用統計,藉由分析歷來大量影像資料之判讀結果,可對每一就診者之影像,給出建議。此即醫療人工智慧,能當做醫師判讀影像之輔助,目前已有多家醫院在進行此類研究計畫。