RISS 검색 - 국내학술지논문 상세보기

부가정보

국문 초록 (Abstract)

제약을 갖는 부분 관찰 의사결정 과정(Constrained Partially Observable Markov Decision Process; CPOMDP)는 정책이 제약(constraint)를 만족하면서 가치 함수를 최적화하도록 일반적인 부분 관찰 의사결정과정(P...

제약을 갖는 부분 관찰 의사결정 과정(Constrained Partially Observable Markov Decision Process; CPOMDP)는 정책이 제약(constraint)를 만족하면서 가치 함수를 최적화하도록 일반적인 부분 관찰 의사결정과정(POMDP)을 확장한 모델이다. CPOMDP는 제한된 자원을 가지거나 여러 개의 목적 함수를 가지는 문제를 자연스럽게 모델링할 수 있기 때문에 일반적인 POMDP에 비해 더 실용적인 장점을 가진다. 본 논문에서는 CPOMDP의 확률적 최적 정책 및 근사 최적 정책을 계산할 수 있는 최적 및 근사 동적 프로그래밍 알고리즘을 제안한다. 최적 알고리즘은 동적 프로그래밍의 각 단계마다 미니맥스 이차 제약 계획 문제를 계산해야하는 반면에 근사 알고리즘은 선형 계획 문제만을 필요로 하는 점-기반(point-based) 가치 업데이트를 이용한다. 실험 결과, 확률적 정책이 결정적(deterministic) 정책보다 더 나은 성능을 보이며, 근사 알고리즘을 통해 계산 시간을 줄일 수 있음을 보였다.

목차 (Table of Contents)

요약
1. 서론
2. Constrained POMDP
3. CPOMDP를 위한 최적 정책 알고리즘
4. CPOMDP를 위한 근사 정책 알고리즘

요약
1. 서론
2. Constrained POMDP
3. CPOMDP를 위한 최적 정책 알고리즘
4. CPOMDP를 위한 근사 정책 알고리즘
5. 실험 결과
6. 결론
참고문헌

동일학술지(권/호) 다른 논문

SFX의 ARM 적시 컴파일러를 위한 레지스터 프로모션
- 한국정보과학회
- 오진석(JinSeok Oh)
- 2011
SC/ACSR : ACSR과 Statechart를 조합한 정형 명세
- 한국정보과학회
- 황대연(Dae Yon Hwang)
- 2011
SAGE 기반 가이드라인 실행 지식 엔진 구현
- 한국정보과학회
- 김정아
- 2011
RNA-Seq 데이터를 이용한 선택 스플라이싱 유형 분석
- 한국정보과학회
- 공진화(Jin-Hwa Kong)
- 2011

동일학술지 더보기

분석정보

View

상세정보조회

Usage

원문다운로드

대출신청

복사신청

EDDS신청

동일 주제 내 활용도 TOP

주제

연도별 연구동향

연도별 활용동향

연관논문

연구자 네트워크맵

공동연구자 (7)

유사연구자 (20) 활용도상위20명

상세검색

RISS 보유자료

상세검색

해외전자자료

제약을 갖는 POMDP를 위한 점-기반 가치 반복 알고리즘 = Point-Based Value Iteration for Constrained POMDPs

부가정보

동일학술지(권/호) 다른 논문

분석정보

이 자료와 함께 이용한 RISS 자료

나만을 위한 추천자료