RDFa 實作
先前筆者於網站上陸續寫了幾篇關於linked data、RDF與RDFa的文章,之後在Kenny熱心的協助下,我們開始進行物種名錄資料庫RDFa,至於為什麼會先選RDFa來進行,我想最大的原因就是它可以保有原本網頁html架構,且容易實作。
先前筆者於網站上陸續寫了幾篇關於linked data、RDF與RDFa的文章,之後在Kenny熱心的協助下,我們開始進行物種名錄資料庫RDFa,至於為什麼會先選RDFa來進行,我想最大的原因就是它可以保有原本網頁html架構,且容易實作。
活動網頁:http://www.bio.ncue.edu.tw/arr/actnews.php?Sn=1
活動時間:2010-01-20 ~ 2010-01-21
活動地點:國立彰化師範大學進德校區
可以在 TaiBIF 新增的功能:
活動心得:
我們是以海報展示的形式參加這次研討會,海報內容是介紹 TaiBIF 網站。在介紹的過程中我強調我們網站是定位在"資料整合"、"入口網站"。由於是作整合的動作,所以我們只有介紹比較普遍的資訊,真正該研究背景的人想看到比較詳細的資料的話,還是需要回到出現記錄提供單位機構的網站;也就是說其他機構不會因為將出現記錄提供給我們之後,使用者就不會再去他們的網站了。
之前因為沒有一個整合所有機構出現記錄的網站,所以國內使用者如果要查詢一個物種的出現資料時,必須要一個個到可能有該物種資料的網站作搜尋,可以想像是相當的費時費力,而 TaiBIF 網站的出現就是為了解決這個問題。現在使用者只需要到 TaiBIF 上面查詢就會看到國內有相關資料的單位與資料內容;其他單位將出現資料提供給我們不僅沒有互相競爭的問題,反而會讓更多的使用者有機會進入提供單位的網站。
又因為國內沒有一個記錄出現資料的共用資料庫格式,使得這些資料的記錄欄位不一,造成資料分享時的極大障礙。在 TaiBIF 內所使用的資料欄位是根據國際標準 Darwin Core。資料庫欄位不是生物背景人員的研究題材,但是卻會對物種資料的流通造成相當大的影響。使用 Darwin Core 不但省去討論到底需要記錄哪些內容的時間、讓生物專家學者可以花更多的力氣在田野調查;也因為使用國際共通標準使得資料可以不費吹灰之力就與國際接軌。
這次活動中 TaiBIF 的使用者回饋並不像前一次參加海洋大學所舉辦的研討會時那麼多,我猜這現象的原因是這次研討會的與會者背景比前一次研討會與會者的背景來的多元;這次活動中有不算少的營利單位,不像上次主要都是學術單位的人參加。因為與會者背景的不同,有不少比例的人表示不知道 TaiBIF 這個網站,所以我覺得這次算是有推廣到我們的網站,有些朋友在了解後覺得這個網站的想法很不錯,值得好好的繼續做下去。
TaiBIF 網站本身的重點不在於學術性論文的發表,而是作為有志於學術研究的學者相當重要的研究基礎資料的來源。身為程式開發者的我相信,開發網站最重要的事情是要親自與使用者對話、了解使用者的想法;大部分的使用者沒有辦法開出軟體需求規格書或是系統架構圖,所以開發者必須與使用者交談,了解他們想要什麼東西,什麼資料與功能對他們而言是有意義的,寫出一個使用者會用而且想用的網站比寫出一個有很多功能的網站來的重要。
筆者於2009年參加TDWG年會時,聽到一位講者介紹關於linked open data 時,講者順道提了英國目前由Tim Berners-Lee進行資料公開上網的消息,而他們所採用的技術為RDFa,希望透過這種Light-Weight RDF可以有效的整合目前存在網路上的「公開資訊」。
傳統上而言Web 提供是一個豐富的分散式的資訊,一個HTML文件可能包含一個標題,接下來用小字型寫了一個子標題、一個斜體、粗體等方式表達網頁的具體內容,最後在包含幾個超鏈結的網址,而現今的網頁中大都遵循這樣的架構,然而這樣的透過瀏覽器的解讀變成人類可以思考理解,對機器而言它卻不知到哪些是文章的標題、哪些是發表日期、哪些是分類的連結,機器與人類的理解存在一些gap。
在”如何利用TAPIR進行中文資料的mapping”文章中告訴各位如何利用 TAPIRLINK 軟體分享資料中的中文欄位,但是因為檔案的遺漏跟錯誤,於是 TaiBIF 進行了一些修正,如果您有對映 http://140.109.29.92/tapirlink/darwinxml/darwin_c.xml 這個檔案的話請您先按圖一中的 unmap 按鈕後再依照”如何利用TAPIR進行中文資料的mapping”重新對映一次。
分類學資料庫工作小組(Taxonomic Databases Working Group, TDWG)於1985年正式成立時,主要是解決世界上主要的植物標本館之間標本資訊整合為首要目標,至1994年時,IUBS(International Union of Biological Sciences)決定其拓至其它生物領域,發展至今目前TDWG的成員已包含世界各國動物學、地質學、微生物學等典藏研究機構,2008年起並將組織名稱加上生物多樣性資訊標準(Biodiversity Information Standards),希望可以透過TDWG協助制定與解決更多資料交換與整合的問題。而在目前全球生物多樣性資訊整合的分工架構中,TDWG扮演著技術研發及資料標準與推廣的角色,就今日世界上主要的生物多樣性資訊服務提供者如各標本館、博物館、全球生物多樣性資訊機構、生命大百科等,其資料庫系統與資訊架構均與TDWG關係密切。而台灣數位典藏計畫中生物主題小組所採用Darwin core,也是該組織所推動制定,另外TDWG資訊擷取存取協定(TAPIR) 是近年TDWG積極推廣,並獲得全球生物多樣性資訊機構(GBIF)、世界各博物館、甚至台灣數位典藏計畫所採用。
Read more…
于名振 台灣東海大學生物系
地球上已經被生物學家鑑定命名的生物約有一百八十萬種,其中包括約二十六萬種植物,五萬種脊椎動物,八十餘萬種昆蟲。而每年被新鑑定發表而增加的生物不下數千種。據估計未被發現並命名的生物尚有二千萬至五千萬種之多。再加上那些掩埋地層中難以數計的化石生物,種數更是驚人。這樣龐大繁雜的生物類群,如何根據其形體結構的繁簡異同,加以歸納整合,而成為一個有一定秩序的分類系統,從而正確地顯現其間或近或疏的親緣關係,提供為深入研究的基礎,便成為當今生物分類學家非常重要的研究課題。 Read more…
古訓銘 中央研究院生物多樣性研究中心
現在學術界在生物界級的分類上頗混亂(實際上每一個階級都混亂),有很多不同的分類系統。從我們的資料庫名錄可以看出來真核生物部分的分界是採用 Cavalier-Smith 的分類系統,但是在這個系統是把生物分為六界,而不是七界,病毒沒有被算在內。會變成七界的原因是因為「三域說」的興起,所以再將原核生物分為細菌與古菌。 Read more…
邵廣昭 中央研究院生物多樣性研究中心
一、 為何生物要命名及分類
為紀念達爾文誕辰兩百週年(Charles Darwin 200),全球各地在2009年正紛紛舉辦各種演化論的研討會。相形之下,2007年剛度過三百週年誕辰的分類學之父,瑞典的植物學家,林奈(Carolus Linnaeus, 1707~1778) (圖一),就好像失色不少。這多少也反映了時下生物學界重演化而輕分類的現象,常以為分類是門傳統落伍的學科,只需要在博物館內的少數學者來進行即可,演化才是尖端創新、可登堂奧的生命科學。殊不知生命科學的研究起源於分類工作,且奠基於分類學,如果沒有林奈首創二名法(制)(binomial system),把各種生物統一命名,即以拉丁文給予一個屬名加上種小名的學名;並建立一個界、門、綱、目、科、屬、種的有階層、有系統的分類架構。否則地球上的同種生物迄今可能還是各命其名,各行其是。 Read more…
洪鈴雅1、顏聖紘2、邵廣昭 1.
(1.中央研究院生物多樣性研究中心 2. 中山大學生物科學系)
分類學家對於一個理想生物分類系統的期待乃是藉由這些分類層級的安排反映各分類群的起源以及它們之間的關係。分類學家依據化石、現生的生物構造、核酸或蛋白質序列,透過親緣關係重建等等方式,提出各種演化假說並據以修訂分類架構。隨著新證據與新技術的發展,以及分類學基礎理論不斷地被修飾,舊的分類架構不斷地被驗證與修訂。