緒論:
- 語言通常有三個重要的層次:聲音、形式和意義.在三個層次中,意義是最重要的一層。透過多變的句法形式去做語意分析,已捕獲句子意義的性質
- 語句關係的兩個派別:Dependency & Constraint
例如:
『我們打敗了敵人』和『敵人被我們所打敗』,屬於不同的句法形式,但他們代表著同樣 的語意形式:打敗(我們、敵人)
以下先簡短地介紹一下詞性分析以及語意分析的定義:
- 詞性分析(Syntactic Analysis):針對 文章中的句子,分析句子中的詞性,例如主詞動詞受詞等等
- 語意分析(Syntactic Analysis):針對文章中的句子,分析文字間的關係
例如: 『認同』有客體(THEME)、目標(Goal)兩個論元,
國人 很認同 傳統家電
| |
THEME GOAL
| |
國人 對傳統家電的 認同已經相當深
: 『違規』有主事者(AGENT)這個論元,在述詞前接一個主事者,語意即完整。
句型:AGENT <*
行人 經常違規
波 |
AGENT
-
-
- 語意分析:
- Constraint:
- S(theme:NP(Head:Nb:柯文哲)|theme:PP(Head:P21:在|DUMMY:NP(property:VP‧的(head:VP(time:Ndabd:國慶日|theme:VP(Head:VC2:穿|aspect:Di:了|goal:NP(quantifier:DM:一件|Head:Ncc:胸口))|Head:V_2:有|range:NP(property:Nab:國旗|Head:Nac:圖案))|Head:DE:的)|Head:Nb:T))|Head:VJ1:恤)#, 這段句子中,Theme 柯文哲有被標記出來,但是他的依存關係需要從整個樹結構做判斷
- Dependency:
- 語意角色標注SRL與SDP:
- 只有語意標註
- 例如:魯迅寫的故鄉是篇好文章。 魯迅/Agent
- 語意角色依存標注SDP:除了語意標註,尚有關係標註。
- 例如:魯迅/agent->寫/re-ContentProduct->故鄉。
- 語意角色標注SRL與SDP:
- Constraint:
- 語意分析:
-
實作語意分析資源:
分析每個字的語法規則,例如上面所提到的例子,『認同』前後的語法規則是接續兩個論元。而這樣的文字的資料庫,在中研院的E-howNet中可以看到。
但全部的語意角色以動詞為目標(這也是CKIP所強調的)。
語意依存分析資源:
哈工大提供以個人或學術研究名義的測試版API :)
文章標籤
全站熱搜
留言列表