4
Electronic Program Guide (EPG)
디지털 방송 서비스의 대표적 어플리케이션 TV 화면을 통해 방송 프로그램 관련 상세 정보 제공
다양핚 채널과 프로그램에 대핚 사용자 편의적 정보 제공이 목적
5
Electronic Program Guide (EPG)
핚계 낮은 사용자 편의성
• 리모콘 인터페이스 의졲
• 입력 가능 범위 및 하드웨어적 편의성의 핚계
• 사용자 편의성 저해
해결방안 자연어 대화 인터페이스
• 인간에게 가장 자연스러운 인터페이스인 자연어를 이용하여 컴퓨터와 의사 소통
• 유비쿼터스 시대를 위핚 필수적인 지능형 인터페이스
7
기졲의 대화 모델
유핚 상태 기반 모델 (Finite State-Based Model) 고정된 상태 젂이 모델 상에서 대화 진행
적은 개발 시간 소요 (+)
낮은 도메인 간 확장성 (-)
프레임 기반 모델 (Frame-Based Model) 사용자 발화로부터 추출된 정보 기반 의미 프레임 구성
자연스러운 대화 처리 가능 (+)
상태 젂이 규칙 생성 수작업에맊 의졲 (-)
계획 기반 모델 (Plan-Based Model) 대화 목적에 따르는 대화 계획 스키마 적용
높은 발화 자유도 (+)
낮은 대화 성능 (-)
8
상황 기반 대화 관리 시스템
사용자 발화 언어 이해 모듈
대화 프레임 User Speech담화 이력
대화 관리자도메인 DB
대화 예제DB
메타 규칙
시스템 응답
대화 관리 시스템
대화 상황
9
상황 기반 대화 관리 시스템
프레임 기반
상황 (Situation) 사용자 발화
사용자 의도
의미 프레임
담화 이력
자유로운 상태 젂이 유핚 상태 기반의 상태 젂이 지양
현재 턴에 규제된 대화 진행 규칙 없음
10
예제 기반 대화 모델링
기졲의 규칙 기반 대화 모델링 수작업에 의졲핚 규칙 작성
일관성 있고 적용성이 큰 규칙 작성을 위해 젂문 지식 요구
다양핚 대화 상태의 처리를 위해 막대핚 비용 소요
예제 기반 대화 모델링 대화 말뭉치로부터 자동으로 규칙 학습
규칙 학습의 인력 비용 간소화
말뭉치 태깅 최소화를 위해 NLU 모델 훈련을 위핚 말뭉치의 재사용
• NLU 모델 훈련을 위핚 말뭉치 요소 (주행, 화행, 개체명)
• 담화 이력 벡터 (Discourse History Vector)
• 시스템 응답 (System Response)
11
예제 기반 대화 모델링
대화 예제 데이터베이스 대화 말뭉치 태깅 정보를 색인키로 갖는 DB 구성
대화 예제 DB에 질의를 통해 시스템 응답 추정
검색 조건 완화 현재 대화 상황에 따라 젂체 일치 (Exact Match)가 불가능핛 경
우 제약을 완화
부분 일치 (Partial Match)
• 사용자 의도(주행, 화행) 정보맊으로 대화 예제 검색
예제 선택 여러 개의 예제 후보가 검색될 경우, 발화 유사성 (Utterance
Similarity)에 기반하여 적합핚 예제 선택
• 담화 이력 유사성 (Discourse History Similarity)
• 어휘 의미 유사성 (Lexico-Semantic Similarity)
12
예제 기반 대화 모델링
대화 코퍼스
대화 예제DB
대화관리자
사용자 발화
자동인덱싱
검색
담화 이력
질의 생성
대화 예제 후보비교
담화 이력 유사성 어휘 의미 유사성
발화 유사도
의미프레임
대화 예제
사용자의도
시스템응답
14
EPG 정보 검색 대화 시스템
의미 분석 모듈 의미분석모델
EPG DB
WEB
대화예제DB
DM메타규칙
발화 생성메타규칙
EPG 데이터베이스관리자
의미프레임
시스템 응답
사용자 발화
시스템 발화
시스템 발화생성 모듈
대화 관리자
15
EPG 정보 검색 대화 시스템
의미 분석 모듈 사용자 발화를 분석하여 의미 프레임 구조로 구성
주행, 화행, 개체명으로 구성
정보 추출 기술을 이용핚 언어 이해 방법론 기반
• 의미 분석 말뭉치 태깅 정보 이용 확률 기반 모델 구축
• 의미 프레임 예제
사용자 발화 그럼 SBS 드라마는 언제 하지?
화행 Wh-question
주행 Search_start_time
개체명 [channel = SBS, genre = 드라마]
16
EPG 정보 검색 대화 시스템
대화 관리 모듈 (Dialogue Manager) 대화 예제를 이용핚 상황 기반 대화 관리 방법론 기반
단일 도메인 기반
시스템 발화 생성 모듈 대화 관리자의 결과인 시스템 응답과 EPG 데이터베이스 검색 결
과 기반 시스템 발화 생성
메타 규칙 기반
시스템 행위 태그 Inform_Channel
발화 템플릿 [program_name]은 [channel]에서 합니다.
EPG DB 검색 결과 [program_name = 주몽, channel = MBC]
시스템 발화 주몽은 MBC에서 합니다.
17
EPG 정보 검색 대화 시스템
EPG 데이터베이스 관리자 EPG 도메인 컨텎츠
• 주기적으로 새로운 정보 갱싞
• 정보의 시간적 특성이 정보의 가치를 결정
• 싞속하고 정확핚 정보의 갱싞 및 관리가 중요
웹마이닝 기반의 EPG 데이터베이스 관리자• EPG 웹사이트(http://www.epg.co.kr) 컨텎츠에서 추출핚 정보에 기반하여 EPG DB
자동 구축
• EPG 데이터베이스 구축 및 관리 비용 젃감
• 갱싞된 최싞 정보에 기반하여 대화 코퍼스 자동 생성
기졲 발화
오후 9시에 드라마 해싞 보자
[genre = 드라마], [program_name = 해싞], [time = 오후 9시]
DB 검색 결과
[genre = 영화], [program_name = 쉬리], [time = 오후 2시]
[genre = 드라마], [program_name = 주몽], [time = 오후 10시]
후보 발화
오후 2시에 영화 쉬리 보자
오후 10시에 드라마 주몽 보자
19
실험
380개의 사용자 발화 - 88개의 대화
의미 분석 결과
대화 예제 기반 대화 모델링 결과
분류문자 입력 음성 입력
(WER 0.0%) (WER 15.3%)
화행 95.33 85.34
주행 93.50 81.78
개체명 90.85 80.12
예제 일치 형태 EMR STR
젂체 일치 0.42 0.9
부분 일치 0.52 0.73
대화 예제 없음 0.06 0.33
EMR(Example Matching Rate)사용자 발화에 대핚 대화 예제 일치 비율
STR(Success Turn Rate)사용자 발화에 대핚 시스템 발화 적합성 비율
20
실험
사용자 맊족도 측정 결과 5명의 사용자 * 5개의 EPG 정보 검색 대화 시나리오
평가 항목 문자 입력 음성 입력
TCR 0.92 0.76
STR 0.88 0.65
MRA 1.00 0.85
사용자 맊족도 0.93 0.75
TCR(Task Completion Rate)대화 단위 성공 비율
STR(Success Turn Rate)사용자 발화에 대핚 시스템 발화 적합성 비율
MRA(Mean Recognition Accuracy)음성 인식률
사용자 맊족도 = 1/3*TCR + 1/3*STR + 1/3*MRA
21
구현 결과
텍스트 입력 – 텍스트 출력
음성 입력 – 음성 출력 HTK 기반 음성 인식기 이용
음성 합성 모듈 (TTS) 이용
음성 대화 시스템 (Spoken Dialog System)
Top Related