>source

빔 검색 알고리즘 에 대한 질문이 있습니다.

그런 말을합시다n= 2.(모든 노드에서 확장 할 노드 수). 그래서 처음에는 우리가 익스포트하는 2 개의 노드가있는 루트 만 가지고 있습니다. 이제 그 두 노드에서 우리는 두 가지를 더욱 팽창시킵니다. 그래서, 순간에 4 개의 잎이 있습니다. 우리가 답변을 찾을 때까지 우리는 이렇게 계속 될 것입니다.

빔 검색이 작동하는 방식은 이것입니다. 그것이 확장됩니까?n= 2.모든 노드 중 또는 모든 시간에 2 개의 잎 노드를 유지합니까?

나는 그것을 생각하는 데 사용했다n= 2.각 노드에서 최대 2 개의 활성 노드가있는 경우 전체 트리가 아니라 2 개의 활성 노드가 있어야합니다.

업데이트 된 답변을 확인하십시오.

Lerner Zhang2021-09-18 01:56:41
  • 답변 # 1

    빔 검색에서 각 시간 소조에서 생성 할 최상의 토큰을 선택하는 대신 각 단계에서 k 가능한 토큰을 유지합니다. 이 고정 크기의 메모리 풋 프린트 K는 넓은 폭 빔의 은유에 넓거나 좁아 지거나 좁아 지도록 매개 변수를 지정할 수있는 빔 너비라고합니다.

    디코딩의 첫 번째 단계에서 전체 어휘를 ​​통해 SoftMax를 계산하여 각 단어에 확률을 할당합니다. 그런 다음이 SoftMax 출력에서 ​​K-Best 옵션을 선택합니다. 이러한 초기 K 출력은 검색 프론티어이며 이러한 k 초기 단어는 가설이라고합니다. 가설은 출력 시퀀스, 그 확률과 함께 -멀리 번역 된 것입니다.

    후속 단계에서

    kest 가설의 각각은 서로 뚜렷한 디코더에 전달되어 각각의 어휘에 대한 소프트 맥스를 생성하기 위해 모든 가능한 토큰으로 가설을 연장시킨다. 이들 각각의 K * V 가설들 각각은 p (yi | x, y < i) : 현재 단어 선택의 확률의 생성물은 그것으로 이어지는 경로의 확률을 곱한 것으로 곱합니다. 우리는 그래서 검색의 국경에서 K 가설보다 결코 더없고, 결코 더 케이 디코더보다는 K 최선의 가설에 이르기까지 K * V 가설 치기.

    빔 크기 (또는 빔 폭)는 앞에서 언급 한 K입니다.

    소스 : https://web.stanford.edu/~jurafsky/slp3/ed3book.pdf.

    나는 그것을 혼란스럽게 발견했기 때문에 당신의 대답을 무너 뜨 렸습니다. 당신은 "위의 그림이 모든 것을 말하기"라고 말하면서 시작합니다. 그러나 그것을보고, 그것은 아무 것도 말하지 않습니다. 일반적 으로이 분명한 대답을 찾지 못합니다. 답변을 선명하게하십시오. 또한 그림을 설명하고, 나는 내 다운 뷰를 제거 할 것입니다.

    nbro2021-09-17 20:02:34

    @nbro 나는 지금 답을 궁금해하고 궁금해했던 것입니다.

    Lerner Zhang2021-09-18 01:39:46
  • 답변 # 2

    빔 검색에서 각 시간 소조에서 생성 할 최상의 토큰을 선택하는 대신 각 단계에서 k 가능한 토큰을 유지합니다. 이 고정 크기의 메모리 풋 프린트 K는 넓은 폭 빔의 은유에 넓거나 좁아 지거나 좁아 지도록 매개 변수를 지정할 수있는 빔 너비라고합니다.

    디코딩의 첫 번째 단계에서 전체 어휘를 ​​통해 SoftMax를 계산하여 각 단어에 확률을 할당합니다. 그런 다음이 SoftMax 출력에서 ​​K-Best 옵션을 선택합니다. 이러한 초기 K 출력은 검색 프론티어이며 이러한 k 초기 단어는 가설이라고합니다. 가설은 출력 시퀀스, 그 확률과 함께 -멀리 번역 된 것입니다.

    후속 단계에서

    kest 가설의 각각은 서로 뚜렷한 디코더에 전달되어 각각의 어휘에 대한 소프트 맥스를 생성하기 위해 모든 가능한 토큰으로 가설을 연장시킨다. 이들 각각의 K * V 가설들 각각은 p (yi | x, y < i) : 현재 단어 선택의 확률의 생성물은 그것으로 이어지는 경로의 확률을 곱한 것으로 곱합니다. 우리는 그래서 검색의 국경에서 K 가설보다 결코 더없고, 결코 더 케이 디코더보다는 K 최선의 가설에 이르기까지 K * V 가설 치기.

    빔 크기 (또는 빔 폭)는 앞에서 언급 한 K입니다.

    소스 : https://web.stanford.edu/~jurafsky/slp3/ed3book.pdf.

    나는 그것을 혼란스럽게 발견했기 때문에 당신의 대답을 무너 뜨 렸습니다. 당신은 "위의 그림이 모든 것을 말하기"라고 말하면서 시작합니다. 그러나 그것을보고, 그것은 아무 것도 말하지 않습니다. 일반적 으로이 분명한 대답을 찾지 못합니다. 답변을 선명하게하십시오. 또한 그림을 설명하고, 나는 내 다운 뷰를 제거 할 것입니다.

    nbro2021-09-17 20:02:34

    @nbro 나는 지금 답을 궁금해하고 궁금해했던 것입니다.

    Lerner Zhang2021-09-18 01:39:46
  • 답변 # 3

    "표준"빔 검색 알고리즘모든 단계에서 현재 "알고있는"노드의 총 수는 제한적이며 각 노드에서 수행 할 노드 수는 아닙니다.

    구체적으로, 만약n= 2., 그것은 "빔"이 항상 2 일에 크기가 될 것임을 의미합니다. 따라서 처음에는 하나의 노드에서 시작한 다음 도달 할 수있는 모든 노드를 발견하지만 모든 것을 삭제하지만 2 개를 삭제하고 2 단계로 1 단계를 마침내 마시게됩니다. 2 단계에서 두 개의 노드가 있으며 정확히 2 개의 노드 (각각에서 아닌 합계)를 제외하고 모두 모두 확장하고 모든 노드를 다시 삭제합니다. 다음 단계에서 마찬가지로 각 단계 후에 2 개의 노드를 유지합니다.

    어떤 노드가 대상에 가장 가까운 노드를 평가하는 몇 가지 휴리스틱 함수에 의해 유지되는 노드가 일반적으로 수행되는지 선택합니다.

    빔 검색 알고리즘 은 완전하지 않음 (즉, 하나가 존재하는 경우 해결책을 찾지 못할 수도 있음)을 최적화 (즉, 최상의 해결책을 찾지 못할 수도 있음). 이것을 볼 수있는 가장 좋은 방법은 언제n= 1., 기본적으로로 가해집니다 최고의 검색...에

  • 답변 # 4

    "표준"빔 검색 알고리즘모든 단계에서 현재 "알고있는"노드의 총 수는 제한적이며 각 노드에서 수행 할 노드 수는 아닙니다.

    구체적으로, 만약n= 2., 그것은 "빔"이 항상 2 일에 크기가 될 것임을 의미합니다. 따라서 처음에는 하나의 노드에서 시작한 다음 도달 할 수있는 모든 노드를 발견하지만 모든 것을 삭제하지만 2 개를 삭제하고 2 단계로 1 단계를 마침내 마시게됩니다. 2 단계에서 두 개의 노드가 있으며 정확히 2 개의 노드 (각각에서 아닌 합계)를 제외하고 모두 모두 확장하고 모든 노드를 다시 삭제합니다. 다음 단계에서 마찬가지로 각 단계 후에 2 개의 노드를 유지합니다.

    어떤 노드가 대상에 가장 가까운 노드를 평가하는 몇 가지 휴리스틱 함수에 의해 유지되는 노드가 일반적으로 수행되는지 선택합니다.

    빔 검색 알고리즘 은 완전하지 않음 (즉, 하나가 존재하는 경우 해결책을 찾지 못할 수도 있음)을 최적화 (즉, 최상의 해결책을 찾지 못할 수도 있음). 이것을 볼 수있는 가장 좋은 방법은 언제n= 1., 기본적으로로 가해집니다 최고의 검색...에

  • 이전 java : ArrayList에 저장되는 클래스를 확인하는 방법은 무엇입니까?
  • 다음 ios : Swiftui에서 탭되는 시스템 경고 단추 감지