>

텍스트의 단어로 그래프를 만들어야하는 프로젝트를하고 있습니다. 비슷한 의미의 단어를 일반적인 동의어로 바꾸고 싶습니다. 예를 들어, 텍스트에 'Murder', 'Kill'및 'slay'가있는 경우. 이 모든 것을 'Kill'과 같은 공통 동의어 (약간의 의미가 다를 수 있음)로 바꾸고 싶습니다. 파이썬에서 어떻게해야합니까?

NLTK synset을 시도했지만 비슷한 단어가 모두 동의어로 대체 될 수있는 방법을 찾지 못했습니다.


  • 답변 # 1

    간단한 기계 학습 문제입니다. 클러스터링 알고리즘을 사용하십시오.

    단어를 벡터로 변환하고 벡터 플롯을 기반으로 유사한 단어를 그룹화합니다. 비슷한 단어로 바꾸려면 각 클러스터에서 한 단어를 선택하십시오.

관련 자료

  • 이전 MATLAB에서 함수 배열을 만드는 방법은 무엇입니까?
  • 다음 oracle - 중개 테이블을 피하는 가장 좋은 방법은 무엇입니까?