http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
웨이블릿 평면의 픽셀별 가중 결합을 이용한 위성 영상 융합
김기백(Gibak Kim) 대한전기학회 2020 전기학회논문지 Vol.69 No.1
We propose a wavelet-based method for fusing satellite images. The proposed scheme is based on the wavelet decomposition. A linear combination of wavelet planes is presented, which includes terms for avoiding overlapping high frequency component and enhancing details. To consider the local characteristics of image, weights are imposed on each pixel of the image and the high resolution image is synthesized in a pixel-wise fusion. The weights are estimated by least squares method with lowered resolution images and multiplied by a proper scaling factor. In the experiments, using IKONOS and QuickBird satellite image data, we demonstrated that the proposed method outperforms conventional methods in terms of various objective quality measures.
듀얼 마이크를 이용한 교차 파워 스펙트럼 위상 기반의 음성 구간 검출 알고리즘
김기백(Gibak Kim) 대한전기학회 2020 전기학회논문지 Vol.69 No.1
To detect voice activity in adverse noisy environment, multichannel signal processing can be considered to exploit spatial selectivity. In this paper, a dual-microphone voice activity detection method is proposed to cope with the presence of strong coherent interference. Under the assumption that the direction of the target speech signal is known and the time delay between the two microphones is compensated, it is shown that the maximum of windowed averaging of real coherence function provides a reliable feature for the voice activity detection even in low signal-to-interference ratio case. The coherence function is based on the cross power spectrum phase between the two microphones. In the experiments, isolated digit utterances are convolved with impulse responses to simulate dual-microphone signals. The experimental results show that the proposed method provides more reliable feature for the voice activity detection in the presence of strong coherent interference.
음성 명료도 향상을 위한 학습 기반의 신호 대 잡음 비 추정을 이용한 이산 마스크 추정 방법
김기백,Kim, Gibak 한국방송∙미디어공학회 2012 방송공학회논문지 Vol.17 No.6
본 논문에서는 시간-주파수 영역에서의 이산 마스킹을 이용하여 잡음환경 음성의 음성 명료도를 높이는 방법에 대해 다루고자 한다. 잡음이 섞여 있는 음성신호를 시간-주파수 영역으로 분해하여, 상대적으로 잡음이 많이 섞여 있는 시간-주파수 영역의 신호를 마스크 "0"을 할당하여 제거함으로써 음성명료도를 향상시킬 수 있다. 이러한 이산 마스크를 추정하기 위해서는 각 시간-주파수 영역에서 신호 대 잡음 비를 추정하여 문턱값과 비교해야 하는데, 본 논문에서는 학습 기반의 신호 대 잡음 비 추정방법을 사용하여 문턱값과 비교하여 이산 마스크를 추정한다. 신호 대 잡음 비와 비교하기 위한 문턱값은 모든 주파수 대역에 대해 동일한 값을 이용하는 고정 문턱값 외에도 주파수 대역에 따라 학습 데이터의 분포로부터 최적의 값을 사용하는 최적 문턱값을 제안한다. 제안된 이산 마스크 추정 방법은 잡음 환경 데이터에 적용한 후, 피험자에게 들려주어 음성 명료도를 측정한다. This paper deals with a noise reduction algorithm which uses the binary masking approach in the time-frequency domain to improve speech intelligibility. In the binary masking approach, the noise-corrupted speech is decomposed into time-frequency units. Noise-dominant time-frequency units are removed by setting the corresponding binary masks as "0"s and target-dominant units are retained untouched by assigning mask "1"s. We propose a binary mask estimation by comparing the local signal-to-noise ratio (SNR) to a threshold. The local SNR is estimated by a training-based approach. An optimal threshold is proposed, which is obtained from observing the distribution of the training database. The proposed method is evaluated by normal-hearing subjects and the intelligibility scores are computed by counting the number of words correctly recognized.
GrabCut 을 이용한 배경 분리 알고리즘의 정확도 개선
이상훈(Sang-Hoon Lee),김기백(Gibak Kim),조남익(Nam Ik Cho) 한국방송·미디어공학회 2015 한국방송공학회 학술발표대회 논문집 Vol.2015 No.7
본 논문에서는 기존의 배경 분리 알고리즘 결과에 GrabCut 알고리즘을 도입하여 보다 정확한 배경 분리를 수행하고자 한다. 기존의 알고리즘은 동영상의 프레임 간 정보만을 이용하여 배경 확률 모델을 만들고 배경과 전경을 분리한다. 제안하는 알고리즘에서는 먼저 프레임 간의 정보를 이용하여 간단하게 배경과 전경을 분리하는 기존의 배경 분리 알고리즘을 적용한다. 분리된 결과의 정확도를 향상시키기 위해 프레임 내의 정보를 이용하는 GrabCut 알고리즘을 적용한다. 즉, 본 연구에서는 동영상의 프레임 간 정보와 프레임 내 정보를 모두 이용하여 배경과 전경을 분리하고자 한다. 실험결과에서 Change Detection Workshop dataset 에 포함된 몇 가지 영상에 대해 실험 한 후 결과 영상 비교 및 F-measure 를 통해 개선된 결과를 확인할 수 있다.