>source

파이썬을 사용하여 시스템을 만들려고 노력하고 있습니다. "분류" "세션 목표"를 사용할 수 있습니다. 기본적으로 각 사용자는 목표 (공부와 관련)를 입력해야합니다. 이러한 목표가 "진짜"라는 것을 탐지하는 기계 학습을 사용하고 어떤 것들은 "멍청이"인지를 탐색하고 싶습니다.

좋은 목표는 다음과 같습니다.

  • "제 1 장"
  • "지리", "생물학"

다른 나쁜 목표는 다음과 같습니다.

  • 공부 "
  • "동일한"
  • "이전과 동일한"
  • 모든 스팸

누구든지 이해할 수있는 기존 code로 인도 할 수 있습니까?

조사

귀하의 질문에 유용한 응답을 받으려면 데이터가 어떻게 생겼는지, 지금까지 시도한 것과 그게 무슨 일이 없었던 것에 대해 펼쳐질 필요가 있습니다. 이것은 당신의 질문에 답변 할 수 있도록 읽는 좋은 게시물입니다.

bicarlsen2021-08-10 15:52:01

고마워, 내 데이터는 실제로 원시 문자열 일뿐입니다. 일부 예제는 게시물에 있습니다. 나는 지금까지 아무것도 시도하지 않았다. 나는 아직도 내가 사용 해야하는 것을 연구하는 단계에 있었다 (그러므로 아무것도 아무것도 없어도). 나는 nlp를 찾았지만 정말로 필요한 것인가는 것 같지 않다.

Gugu722021-08-10 15:55:01

"실제 목표"가 의미하는 것이 불분명하기 때문에 너무 많은 통찰력을주기가 어렵습니다. 그들의 목록을 유지함으로써 "스팸 단어"를 제거하여 처음에는 시작할 수있는 것처럼 보입니다. 학습의 맥락으로 인해 감독 된 분류자는 가장 간단한 일이 시작되는 것처럼 보입니다.

bicarlsen2021-08-10 16:02:02

스팸 단어로 만나는 문제는 다르게 작성되거나, 무시되기 등을 기록 할 수 있습니다. 그 목록은 너무 길거나 효과가 없습니다 (실제로 시도한). 감독 된 분류자는 내가 필요한 것인 것 같지만, 어떤 엔진 /알고리즘을 사용해야하는지 확실하지 않습니다.

Gugu722021-08-10 16:07:20

나는 pytorch로 시작하는 것이 좋습니다. 스팸은 더 간단한 작업을 수행 할 때까지 모델의 측면을 지연시킬 수 있습니다.

bicarlsen2021-08-10 16:27:42
  • 이전 php : 블레이드보기에서 객체 (stdClass)에 액세스하려면 어떻게합니까?
  • 다음 java : 더 많은 컨트롤러를 추가 할 때 Spring MVC 성능이 크게 떨어집니다