hmm 예제

숨겨진 마르코프 모델은 주에서 일부 확률 분포에 따라 관측값을 방출하는 복잡한 마르코프 프로세스를 모델링할 수 있습니다. 이러한 예 중 하나는 가우시안 분포입니다. 이러한 숨겨진 마르코프 모델에서 상태 출력은 가우시안 분포로 표시됩니다. 이 코드 에서 start_probability는 Bob이 처음 그녀를 호출 할 때 HMM이 있는 상태에 대한 Alice의 믿음을 나타냅니다 (그녀가 아는 것은 평균적으로 비가 오는 경향이 있다는 것입니다). 여기서 사용되는 특정 확률 분포는 평형 분포가 아니며, 이는 대략 {`Rainy`: 0.57, `써니`: 0.43}입니다. transition_probability는 기본 마르코프 체인의 날씨 변화를 나타냅니다. 이 예에서는 오늘 비가 오면 내일은 화창할 확률이 30%에 불과합니다. 방출_확률은 Bob이 매일 특정 활동을 수행할 가능성을 나타냅니다. 비가 오면 아파트를 청소할 확률이 50%입니다. 화창한 날에는 60%의 확률로 밖에 나가 산책을 할 수 있습니다. 숨겨진 Markov 모델은 관측값과 숨겨진 상태의 공동 분포 또는 숨겨진 상태의 이전 분포(전환 확률)와 주어진 관측값의 조건부 분포를 모두 포함하는 생성 모델입니다. 상태(방출 확률)를 모델링합니다. 위의 알고리즘은 암시적으로 전환 확률에 대한 균일한 사전 분포를 가정합니다.

그러나 다른 유형의 이전 분포를 사용하여 숨겨진 Markov 모델을 만들 수도 있습니다. 전환 확률의 범주형 분포를 감안할 때 명백한 후보는 범주형 분포의 컨쥬게이트 이전 분포인 Dirichlet 분포입니다. 일반적으로 대칭 Dirichlet 분포가 선택되어 어떤 상태가 본질적으로 다른 주보다 더 가능성이 높은지에 대한 무지를 반영합니다. 이 분포의 단일 매개변수(농도 매개변수라고 도는)는 결과 전이 행렬의 상대 밀도 또는 희소성입니다. 1을 선택하면 균일한 분포가 생성됩니다. 1보다 큰 값은 상태 쌍 간의 전환 확률이 거의 같을 가능성이 있는 조밀한 행렬을 생성합니다. 값이 1미만인 값은 지정된 각 소스 상태에 대해 소수의 대상 상태만 무시할 수 없는 전환 확률을 가지는 희소 행렬을 생성합니다. 또한 하나의 디리클렛 분포(상부 분포)가 다른 디리클렛 분포(하부 분포)의 매개 변수를 제어하는 2단계 이전 Dirichlet 분포를 사용할 수도 있습니다. 확률. 상위 분포는 상태의 전체 분포를 제어하여 각 상태가 발생할 가능성을 결정합니다. 농도 매개변수는 상태의 밀도 또는 희소성을 결정합니다.

두 농도 매개 변수가 희소 한 분포를 생성하도록 설정된 이러한 2 단계 사전 분포는 예를 들어 음성의 일부가 다른 부분보다 훨씬 더 일반적으로 발생하는 감독되지 않은 음성 부분 태그 지정에 유용할 수 있습니다. 균일한 사전 분포를 가정하는 학습 알고리즘은 일반적으로 이 작업에서 제대로 수행되지 않습니다. 균일하지 않은 사전 분포를 가진 이러한 종류의 모델의 매개 변수는 Gibbs 샘플링 또는 기대 최대화 알고리즘의 확장 버전을 사용하여 학습할 수 있습니다. 예를 들어, 먼저 관심 있는 위치를 선택해야 하는 경우 숨겨진 시퀀스 즉 y1의 두 번째 위치에 있다고 가정해 보겠습니다. 우리는 시퀀스와 그 점수의 집합을 검사, 단지이 시간, 우리는 y1의 가능한 값으로 시퀀스를 그룹화하고 각 그룹 내에서 총 점수를 계산합니다. 가장 높은 점수를 가진 그룹은 앞으로 / 뒤로 점수위의 정보는 우리의 교육 데이터에서 직접 계산 할 수 있습니다. 예를 들어 그림 2의 날씨 예제의 경우 교육 데이터는 며칠 동안 숨겨진 상태와 관측값으로 구성됩니다. 이 교육 데이터에서 직접 전환, 배출 및 초기 상태 확률의 전환 행렬을 구축할 수 있습니다.

    Outros serviços