형태소 분석
형태소 분석
임의의 텍스트에 대해 형태소 분석을 할 수 있습니다. 형태소 태그는 KAIST에서 출시한 Hannanum 형태소 분석기의 22개의 형태소 분류를 이용합니다. 22개의 형태소 태그에 대한 설명은 이 문서 하단의 형태소 표를 참조하세요.
warning
현재 더욱 정확하고 가벼운 형태소 분석 알고리즘을 개발중입니다. 형태소 분석 기능은 잠시 사용을 보류해주세요! 개발 진행 상황은 github에서 확인하실 수 있습니다.
info
universal dependency의 태그셋을 이용한 형태소 분석도 추후에 제공 할 예정입니다. hama를 개선시킬 새로운 기능에 대한 의견이 있다면 github 이슈 혹은 gitter를 통해 목소리를 들려주세요!
from hama.tagging import tag
# 출력 결과 - (['푸들', '은', '많이', '귀엽다'], ['nc', 'jc', 'ma', 'pv'])
tag("푸들은 많이 귀엽다")
형태소와 Tag 묶어보기
tag
의 zipped
파라미터를 이용해 각 형태소와 태그를 묶어서 출력할 수 있습니다.
from hama.tagging import tag
# 출력 결과 - [('푸들', 'nc'), ('은', 'jc'), ('많이', 'ma'), ('귀엽다', 'pv')]
tag("푸들은 많이 귀엽다", zipped=True)
Callback 기능
hama.init
함수와 비슷하게, tag
함수도 synchronous하지 않은 호출을 위해 callback
파라미터를 지원합니다.
from hama.tagging import tag
def after_tag(res):
print("형태소 분석 완료!\n분석 결과: ", res)
tag("푸들은 많이 귀엽다", callback=after_tag)
형태소 표
태그 | 품사 |
---|---|
nc | 보통명사, 고유명사 |
nb | 의존명사 |
np | 대명사 |
nn | 수사 |
pv | 동사 |
pa | 형용사 |
mm | 관형사 |
ma | 부사 |
ii | 감탄사 |
jc | 격조사, 서술격조사 |
jx | 보조사 |
ep | 선어말어미 |
ec | 연결어미 |
et | 전성어미 |
ef | 종결어미 |
xp | 접두사 |
xs | 접미사 |
f | 외국어 |
s | 문장 부호 |
u | 태그 지정 불가 |