>

영어 단어 임베딩에서 영어 이외의 (영어, 스페인어, 이탈리아어) 단어 임베딩을 어떻게 생성 할 수 있습니까?

영어 이외의 단어에 대해 고품질 단어 삽입을 생성하는 가장 좋은 방법은 무엇입니까?

단어에는 (samsung-galaxy-s9)가 포함될 수 있습니다

  • 답변 # 1

    영어 이외의 단어의 경우 이중 언어 사전을 사용하여 벡터가 포함 된 영어 단어를 번역 할 수 있습니다.

    고품질 단어 임베딩을 생성하려면 큰 모음이 필요합니다. 영어 이외의 경우, 이중 언어 코포 라의 입력으로 원래 w2v 손실에 이중 언어 제한을 추가해야합니다.

    복합 단어를 전체 단어로 간주하거나 응용 프로그램에 따라 나눌 수 있습니다.

  • 답변 # 2

    How can i generate non-english (french , spanish , italian ) word embedding from english word embedding ?

    정말 못해요. 정확히 같은 의미의 단어가 없다면 당신이 왕, 여왕, 여자와 남자에 대한 프랑스어 단어를 알고 있다면, 당신은 그 단어를 영어로 정확히 같은 단어의 포함을 줄 수 있습니다. 영어 단어와 동일한 구문 및 시맨틱 특성을 보여줍니다. 그러나 영어 임베드를 사용하여 다른 언어로 임베드 할 수는 없습니다.

    와이즈 비즈 영어 단어와 영어 이외의 단어는 같은 방식으로 취급 될 수 있습니다. 영어 이외의 단어를 문자열/토큰으로 나타내고 w2v 모델을 훈련시킵니다. 이것을 위해 gensim을 사용하십시오. 원하는 언어에 대한 거대한 모음을 찾아야합니다. 그런 다음 몇 가지 시대를 위해이 거대한 코퍼스로 모델을 훈련해야합니다. 끝난. 또는 필요한 언어로 기존 모델을 찾으십시오.

    와이즈 비즈

    당신의 말뭉치에 "samsung-galaxy-s9"와 같은 단어가 없다면, 모델은 그것이 무엇을 의미하는지 알 수 없습니다. 퍼가기를 사용하려는 도메인에 더 많은 단어가있을 수있는 모음을 사용하십시오.

    What are the best ways to generate high quality word embedding for non - english words

  • 이전 python - Pandas에서 동적 데이터 프레임을 만드는 방법
  • 다음 javascript - jquery를 사용하여 div 내부에서 ID를 얻는 방법