형태소 분석

형태소 분석

임의의 텍스트에 대해 형태소 분석을 할 수 있습니다. 형태소 태그는 KAIST에서 출시한 Hannanum 형태소 분석기의 22개의 형태소 분류를 이용합니다. 22개의 형태소 태그에 대한 설명은 이 문서 하단의 형태소 표를 참조하세요.

warning

현재 더욱 정확하고 가벼운 형태소 분석 알고리즘을 개발중입니다. 형태소 분석 기능은 잠시 사용을 보류해주세요! 개발 진행 상황은 github에서 확인하실 수 있습니다.

info

universal dependency의 태그셋을 이용한 형태소 분석도 추후에 제공 할 예정입니다. hama를 개선시킬 새로운 기능에 대한 의견이 있다면 github 이슈 혹은 gitter를 통해 목소리를 들려주세요!

from hama.tagging import tag
# 출력 결과 - (['푸들', '은', '많이', '귀엽다'], ['nc', 'jc', 'ma', 'pv'])
tag("푸들은 많이 귀엽다")

형태소와 Tag 묶어보기

tagzipped 파라미터를 이용해 각 형태소와 태그를 묶어서 출력할 수 있습니다.

from hama.tagging import tag
# 출력 결과 - [('푸들', 'nc'), ('은', 'jc'), ('많이', 'ma'), ('귀엽다', 'pv')]
tag("푸들은 많이 귀엽다", zipped=True)

Callback 기능

hama.init 함수와 비슷하게, tag 함수도 synchronous하지 않은 호출을 위해 callback 파라미터를 지원합니다.

from hama.tagging import tag
def after_tag(res):
print("형태소 분석 완료!\n분석 결과: ", res)
tag("푸들은 많이 귀엽다", callback=after_tag)

형태소 표

태그품사
nc보통명사, 고유명사
nb의존명사
np대명사
nn수사
pv동사
pa형용사
mm관형사
ma부사
ii감탄사
jc격조사, 서술격조사
jx보조사
ep선어말어미
ec연결어미
et전성어미
ef종결어미
xp접두사
xs접미사
f외국어
s문장 부호
u태그 지정 불가