http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
양방향 LSTM 구조의 계층적 순환신경망을 이용한 가속도 센서 기반 제스처 인식
이명춘(Myeong-Chun Lee),조성배(Sung-Bae Cho) 한국정보과학회 2012 정보과학회논문지 : 소프트웨어 및 응용 Vol.39 No.12
모바일 시장 규모의 증대와 함께 스마트폰에 부착된 센서 또한 정교해지고 다양해지고 있다. 더불어 이를 응용할 수 있는 다양한 형태의 연구가 가능하게 되었다. 특히 방향 센서, 가속도 센서, GPS, 조도 센서 등의 센서들을 이용한 상황 인지, 추천 시스템, 제스처 인식 등의 관련 연구들이 활발히 진행중이다. 본 논문에서는 스마트폰의 가속도 센서를 이용하여 사용자의 제스처를 인식하는 방법을 제안한다. 제스처 데이터에는 상당한 양의 의미 없는 비제스처 데이터 또한 포함되어 있기 때문에 계층적 구조를 사용하여 비제스처를 분류한 후 세부 제스처들을 분류한다. 분류 알고리즘으로 양방향 LSTM 구조의 순환 신경망을 사용한다. LSTM 구조의 순환신경망은 3개의 게이트를 사용함으로써 시퀀스의 길이가 긴 데이터의 인식률이 높다. 양방향 순환신경망은 입력 시퀀스의 양방향 모두 학습하기 때문에 일반적인 신경망보다 성능이 뛰어나다. 제안하는 방법의 성능을 측정하기 위하여 총 21가지의 클래스를 분류하고 24,850개의 시퀀스 데이터를 사용한다. 실험 결과로 기존 BLSTM은 평균 89.17%의 인식률을 기록하였고 계층적 BLSTM은 기존 BLSTM보다 높은 평균 91.11%의 인식률을 나타내었다. The sensors embedded in the smart phone are becoming elaborated and sophisticated from the mobile market growth. The application area such as context aware, recommendation system, gesture recognition are actively investigated from the accelerometer, GPS, luminous, direction sensors, etc. In this paper, we propose a gesture recognition method using an accelerometer embedded smart phone. Since there are a lot of meaningless non-gesture data in real world problem, we classify the data hierarchically. For a classification algorithm, we use RNN (Recurrent Neural Network) with BLSTM (Bidirectional Long Short-Term Memory). LSTM shows high performance with three gates when classifying the long sequences. RNN outperforms conventional ANN (Aftificial Neural Network) since it trains both way of input sequence. To evaluate the proposed method, twenty one classes are classified, and 24,850 sequences are used. The result shows Hierarchical BLSTM (91.11%) outperforms standard BLSTM (89.17%).