39
資料探勘
(
二
)
再給一考古裡資料探勘之例,也是有關辨識文字。古埃及的歷史悠久,約在西元前
4000
年,就已出現多個城邦國家
(city state)
;目前出土的文物中,有約西元前
3400
年前之象形文字
(
亦稱聖書體
(Hieroglyph)
,為古埃及的正式書寫體系,其手寫體則稱為僧侶體
(hieratic))
石板。而埃及的第一王朝,約始於西元前
3150
年,也就是埃及的信史已超過
5
千年。至於舉世聞名的“胡夫金字塔”
(Pyramid of Khufu
,位於吉薩
(Giza)
,在開羅
(Cairo)
西南約
20
里
)
,此當今唯一倖存的
(
古
)
“世界七大奇蹟”
(Seven Wonders of the World)
,約在西元前
2584
至
2561
年間興建。這座以今日眼光來看,仍屬鬼斧神工的建築,古埃及人可是在距今約
4600
年前完成。由於實在超乎人的理解,至今仍不時有人一口咬定“金字塔是外星人所建”。不過從西元前
11
至西元
7
世紀,約
1
千
6
百年間,埃及先後被幾個帝國征服。在西元前
4
世紀下半葉起,希臘與羅馬人的統治時期,古埃及的文明逐漸沒落。到了西元
641
年,埃及更被新興的阿拉伯勢力完全征服,之後便開始阿拉伯化,人民也被迫改信伊斯蘭教
(Islam)
。至
12
世紀,埃及已普遍使用阿拉伯語文
(
至今仍為埃及的官方語文
)
,延綿數千年的古埃及文明,遂被阿拉伯文明所取代。而埃及人對其祖先輝煌的歷史,也就幾乎一無所知了。比較一下,中國的信史,始自約
3500
年前的商朝,遠沒有埃及早。不過即使“中國文明是世界唯一未曾中斷的文明”,此說法雖不盡然正確,但
3500
年來,中國就算曾數度被外族入侵甚至征服,但中原民族的主體語文,並未根本改變或消失,且以傳統漢語文寫成的古典文獻,保存至今。
古希臘馬其頓的亞歷山大大帝
((Alexander the Great
,西元前
356
-
323
年
)
過世後,他建立的橫跨歐亞非之大帝國迅速瓦解,被他的幾個部屬瓜分。埃及歸托勒密王朝
(Ptolemaic dynasty
,西元前
305-
西元
30
年
)
,由托勒密一世
(Ptolemy I Soter
,西元前
367-282
年,西元前
305-282
年在位
)
所開創。托勒密王朝的歷任君主,皆為希臘人的後裔,因而一直習於使用希臘語文。雖統治埃及,但王室幾乎都對學習埃及語文毫無興趣。不過官方文件,仍採希臘文與埃及文並存。到了
1
世紀,古埃及的象形文字便不再通行了。基督教的興起,一神論的主張,更迫使埃及人不再興建被羅馬人視為“異教”的神廟。原本建造神廟時,會在牆壁及梁柱等處,刻上象形文字,敘述一些重要事蹟。如今這需求沒有了,於是象形文字漸趨式微,而已存在神廟裡幾千年,無數的象形文字雕刻,遂逐漸形同廢文,只能當成藝術品看待了。現存最後一個標示有日期的神廟上之象形刻文,時間是西元
398
年
8
日
24
日。此後便不再有了,因象形文字,刻或寫給誰看呢?約到
5
世紀後,古埃及所留下大量又重要的文件,便再也無人看得懂了。誰能讓那些從
5
世紀起,便被視為藝術品的象形文字,成為有意義的文字呢?
法國學者商博良
(
尚
-
法蘭索瓦商博良,
Jean-Francois Champollion
,
1790-1832)
,在語言方面極具天賦,精通多種文字,且對科普特
(Coptic)
文,特別感興趣,那是西元
1
世紀後,埃及所創造出之文字。在
18
至
19
世紀初,當時考古學僅在萌芽階段,尚非一能嚴肅看待的科學。“聖經”的“創世紀”裡,有描述一些人類早期的歷史,只是那畢竟是以色列人所記,人類的誕生,真是那樣嗎?古埃及那些看起來神秘無比的象形文字中,是否有關於世界起源的記載,可用來與“聖經”相互印證?令人好奇。這是何以那時對人類世界起源有興趣者,讀了“聖經”後,不少會對古埃及的文化,產生濃厚興趣的原因之一。但由於象形文字無人能識,以致對古埃及的了解,當時幾乎一片空白。
1809
年,商博良
19
歲時,決定投入科普特文的學習,他想藉由科普特文,來通向古埃及文。
1798
年
5
月,拿破崙
(Napoleon Bonaparte
,
1769-1821)
率軍出征埃及,與遠征軍隨行之考察團,包含約
175
位各領域的學者,預計進行各項研究。埃及人習於立碑,凡有什麼大事,便立個碑刻上事件經過。古物的挖掘,亦是考察團此行的目的之一。法軍在羅塞塔
(Rosetta
,位於亞歷山大城以東約
65
公里
)
,發現一塊石碑,其上刻有
3
段文字,乃
3
種可對照的字體:希臘文、古埃及象形文字,及古埃及通俗文
(
亦稱世俗體
(Demotic)
,由僧侶體演變而成
)
。此
3
種文字,皆為托勒密王朝時流通的文字。經翻譯希臘文後,得知這是西元前
196
年
3
月
27
日,孟斐斯
(Memphis
,位於開羅南方
20
公里處,曾是古埃及的首都
)
祭司所撰寫的敕令。記述托勒密五世
(Ptolemy V Soter
,西元前
209-181
年,西元前
204-181
年在位
)
的即位慶典。
此塊在拿破崙時代,已有將近兩千年歷史的石碑,隨即被運至開羅。法國科學家興奮莫名,當下進行文字拓印、素描,及鑄模,且做出多種複製品,並開始研究。他們樂觀地以為,象形文字的解讀,已指日可待。只是並沒那麼容易,還要再經過至少
20
年的艱辛鑽研,才能破解。
1801
年,法軍敗於英軍。英國本要將法國所有的研究成果,以及那塊令他們垂涎不已的石碑都沒收。寧為玉碎不為瓦全,法國學者威脅要毀去一切,包括石碑。最後英國不得不讓步,同意法國可保留研究資料及石碑拓片等,他們只奪走石碑。法國人並沒什麼好抱怨的,因向來弱肉強食,何況一切都沒問埃及人的意見。後來石碑便以發現地,命名為羅塞塔石碑
(Rosetta Stone)
,今日在大英博物館展示。
古埃及人以莎草紙
(papyrus
,以紙莎草
(apyrus sedge)
的莖製成
)
來書寫,這種文書便稱為“紙草文書”。古埃及人遺留下大量的“紙草文書”,沙漠地區乾燥的氣候,讓文書能長期保存良好,但至
19
世紀初,已長達
1
千多年無人能辨識。商博良從
1822
至
1824
年間,全心全力投入羅塞塔石碑上象形文字的研究。他熟悉希臘文,持續相互比對羅塞塔石碑上的
3
種字體,並運用他的科普特文知識,終於逐漸能了解某些古埃及通俗文字之意義。此外,他閱讀無數“紙草文書”,加上不斷推測,有如在解密碼。
1822
年,他成功地譯解出古埃及象形文字的結構,並編出完整的埃及文字符號和希臘字母的對照表。長達
3
千年,無數古埃及的歷史文獻,終於可一一解開了。
1824
年
6
月,商博良經阿爾卑斯山
(Alps)
,前往義大利北部杜林
(Turin)
,那裡有大量古埃及象形文字文獻的收藏。他找到一份莎草紙文書,那是拉美西斯二世
(Ramesses II
,約西元前
1303-1213
年,約西元前
1279-1213
年在位
)
時製的。由於其上列有在拉美西斯二世之前,歷代法老的名字,後來便以發現地,將此份文書命名為“杜林國王名冊”
(Turin King List)
。雖有若干脫漏,但在拉美西斯二世以前,
3
百多位埃及統治者的名字,及各自在位的時期,仍大致知道了。此對了解古埃及史,助益極大。對商博良的研究過程有興趣者,不妨去看“破解古埃及”
(The Keys of Egypt: The Race to Read Hieroglyphs
,
2001
,萊斯利亞京斯與羅伊亞京斯
(Lesley Adkins and Roy Adkins)
著,黃中憲
(2007)
為中譯本
)
一書。
不要說探勘不見得必有所獲,人們常說大數據,但有了大數據,一切就能迎刃而解嗎?對“殷墟”出土的那約
10
萬片的甲骨,雖文字的演變多少有些脈絡可尋,但已確認的
5
千多個相異字中,能辨識的也不過
1
千
7
百多字,才佔約
1/3
。其他約
2/3
就束手無策了。古埃及人留下不可計數之“紙草文書”,大數據在那裡。但經反覆比對,就能撥開謎網,讀懂古埃及文了嗎?事實上,
19
世紀初,英法等國同時有多人致力於破解工作,只是進展一直很有限。直到羅塞塔石碑出土,而將閱讀古埃及文,視為一生懸命的語言天才商博良,看出如何利用此石碑,辨識古埃及文,終於得以破解。所以,並非任誰有了大數據,便有了解密鑰匙,無往不利。其他像人工智慧
(Artificial intelligence
,縮寫
AI)
也是一樣。眾所皆知,獲年度總冠軍,為
NBA
各隊最高目標,但付出天價年薪,聚集幾個頂尖球員,得總冠軍便能如探囊取物嗎?顯然不一定。同樣地,也非利用電腦,便能有支智慧棒,指揮一切。自己須先有智慧才行。
因覺身上某部位不太對勁,到醫院看診後,醫生指示做影像檢查,諸如照
X
光、超音波、電腦斷層掃描
(Computed Tomography
,縮寫
CT)
、核磁共振造影
(Magnetic Resonance Imaging
,縮寫
MRI)
、正子斷層造影
(Positron Emission Tomography
,縮寫
PET)
等。得到一些影像後,要有專人判讀,了解病因,以對症治療。影像判讀會有失誤嗎?在資料眾多下,或許難免吧!利用統計,藉由分析歷來大量影像資料之判讀結果,可對每一就診者之影像,給出建議。此即醫療人工智慧,能當做醫師判讀影像之輔助,目前已有多家醫院在進行此類研究計畫。