緒論:
  1. 語言通常有三個重要的層次:聲音、形式和意義.在三個層次中,意義是最重要的一層。透過多變的句法形式去做語意分析,已捕獲句子意義的性質
  2. 語句關係的兩個派別:Dependency & Constraint
 
 
例如:
 
『我們打敗了敵人』和『敵人被我們所打敗』,屬於不同的句法形式,但他們代表著同樣               的語意形式:打敗(我們、敵人)
 
     
以下先簡短地介紹一下詞性分析以及語意分析的定義:
 
  • 詞性分析(Syntactic Analysis):針對 文章中的句子,分析句子中的詞性,例如主詞動詞受詞等等
 
  • 語意分析(Syntactic Analysis):針對文章中的句子,分析文字間的關係
 
          例如: 『認同』有客體(THEME)、目標(Goal)兩個論元,
                    
                         國人 很認同 傳統家電
                            |               |
                        THEME          GOAL
                              |                  |
                         國人                對傳統家電的 認同已經相當深
 
                     : 『違規』有主事者(AGENT)這個論元,在述詞前接一個主事者,語意即完整。
                         句型:AGENT <*
               
                                    行人 經常違規
                     波                   |
                                   AGENT
 
      • 語意分析:
        • Constraint:
          •  S(theme:NP(Head:Nb:柯文哲)|theme:PP(Head:P21:在|DUMMY:NP(property:VP‧的(head:VP(time:Ndabd:國慶日|theme:VP(Head:VC2:穿|aspect:Di:了|goal:NP(quantifier:DM:一件|Head:Ncc:胸口))|Head:V_2:有|range:NP(property:Nab:國旗|Head:Nac:圖案))|Head:DE:的)|Head:Nb:T))|Head:VJ1:恤)#,  這段句子中,Theme 柯文哲有被標記出來,但是他的依存關係需要從整個樹結構做判斷
        • Dependency:
          • 語意角色標注SRL與SDP:
            • 只有語意標註
            • 例如:魯迅寫的故鄉是篇好文章。 魯迅/Agent
          • 語意角色依存標注SDP:除了語意標註,尚有關係標註。
            • 例如:魯迅/agent->寫/re-ContentProduct->故鄉。
 
實作語意分析資源:
    
分析每個字的語法規則,例如上面所提到的例子,『認同』前後的語法規則是接續兩個論元。而這樣的文字的資料庫,在中研院的E-howNet中可以看到。
但全部的語意角色以動詞為目標(這也是CKIP所強調的)。
 
語意依存分析資源:
 
哈工大提供以個人或學術研究名義的測試版API :) 
arrow
arrow
    創作者介紹
    創作者 HaoWei 的頭像
    HaoWei

    NLP Notes

    HaoWei 發表在 痞客邦 留言(0) 人氣()