RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        좌-우향 은닉 마코프 모델에서 상태결정을 이용한 음질향상

        이기용 한국음향학회 2004 韓國音響學會誌 Vol.23 No.1

        본 논문에서는 좌-우향은닉 마코프 모델 (Left-Right Hidden Markov Model)에서 상태결정을 갖는 음성향상방법을 제안하였다. 은닉 마코프 모델에 기초를 둔 음질향상 방법은 성능은 우수하나, 모든 상태에 대해서 음질향상 알고리즘을 계산하므로, 계산량이 많고, 메모리가 많이 필요하여 실시간 처리에 부적절하다. 좌-우향 은닉 마코프 모델은 마코프 모델을 좌측에서 우측으로의 전이만 허용하는 모델로 단순화시켜 현재 상태에서 현재 상태나 다음 상태로 전이될 수 있는 특성을 가지고 있다. 본 논문에서는, 좌-우향 은닉 마코프 모델에서 유사도비 테스트 (Log-Likelihood Ratio Test)를 이용하여 현재 음성의 상태를 결정하는 알고리즘을 제안하였다. 현재 음성의 상태를 알고 있다면, 현재 상태에 대해서만 음질향상 알고리즘을 계산하므로, 계산량이 줄어든다. 제안된 방법의 성능 평가를 위하여 음질 향상 시간과 신호 대 잡음비를 비교하였다. 제안된 방법은 기존의 방법에 비해 음질향상의 결과는 약 0.2∼0.4 dB 정도 떨어졌지만, 계산량을 많이 줄일 수 있었다. We propose a new speech enhancement algorithm based on left-right Hidden Markov Model (HMM) with state decision using Log-likelihood Ratio Test (LRT). Since the conventional HMM-based speech enhancement methods try to improve speech quality for all states, they introduce huge computational loads inappropriate to real-time implementation. In the left-right HMM, only the current and the next state are considered for a possible state transition so to reduce the computational complexity. In this paper, we propose a method to decide the current state by using the LRT on the previous state. Experimental results show that the proposed method improves the speed up to 60% with 0.2∼0.4 dB degradation of speech quality compared to the conventional method.

      • KCI등재

        음질향상을 위해 비선형 함수와 사전 음성부재확률을 이용한 최소통계법의 잡음전력편의 보상방법

        이수정,이강성,김순협,Lee, Soo-Jeong,Lee, Gang-Seong,Kim, Sun-Hyob 한국음향학회 2009 韓國音響學會誌 Vol.28 No.1

        본 논문에서는 비정상 잡음환경에서 음질향상을 위한 비선형 함수와 사전 음성부재 확률을 이용한 최소 통계치(MS) 방법의 잡음전력편의 보상 방법을 제안한다. 비정상 잡음환경에서 잡음전력추정을 위해 최소 통계치 방법이 잘 알려져 있지만, 예측된 잡음전력 추정 값은 실제 잡음 전력 값보다 하향 편의 되는 특성을 나타낸다. 제안한 방법은 비선형 함수를 적용한 적응보상파라미터와 사전 음성부재 확률 값을 혼용하는 잡음전력편의 보상방법이다. 특히, 적응보상 파라미터는 사후 SNR을 이용한 비 선형함수를 적용하여 잡음수준의 증감에 따라 파라미터 값을 조절한다. 또한, 사전 음성부재확률 값이 1로 수렴할 경우, 적응보상파라미터 값은 각 주파수별로 최대치까지 증가하지만, 확률 값이 0에 가까워지면 반대의 특성을 나타낸다. 제안한 알고리즘의 잡음전력추정 및 음질향상의 성능평가를 위해 다양한 종류의 잡음과 비정상적인 극심한 잡음환경을 설정하여 실험하고, 음질향상을 위해 주파수 차감법과 결합하였다. 알고리즘의 성능은 다양한 잡음환경의 신호 대 잡음비 (SNR)와 Itakura-Saito 음질왜곡 평가법을 이용하여 기존 최소 통계치 (MS)방법에 비해 우수한 결과를 나타냈다. This paper proposes a new noise-biased compensation of minimum statistics(MS) method using a nonlinear function and a priori speech absence probability(SAP) for speech enhancement in non-stationary noisy environments. The minimum statistics(MS) method is well known technique for noise power estimation in non-stationary noisy environments. It tends to bias the noise estimate below that of true noise level. The proposed method is combined with an adaptive parameter based on a sigmoid function and a priori speech absence probability (SAP) for biased compensation. Specifically. we apply the adaptive parameter according to the a posteriori SNR. In addition, when the a priori SAP equals unity, the adaptive biased compensation factor separately increases ${\delta}_{max}$ each frequency bin, and vice versa. We evaluate the estimation of noise power capability in highly non-stationary and various noise environments, the improvement in the segmental signal-to-noise ratio (SNR), and the Itakura-Saito Distortion Measure (ISDM) integrated into a spectral subtraction (SS). The results shows that our proposed method is superior to the conventional MS approach.

      • KCI등재

        비정상 잡음환경에서 음질향상을 위한 적응 임계 치 알고리즘

        이수정,김순협,Lee, Soo-Jeong,Kim, Sun-Hyob 한국음향학회 2008 韓國音響學會誌 Vol.27 No.7

        This paper proposes a new approach for speech enhancement in highly nonstationary noisy environments. The spectral subtraction (SS) is a well known technique for speech enhancement in stationary noisy environments. However, in real world, noise is mostly nonstationary. The proposed method uses an auto control parameter for an adaptive threshold to work well in highly nonstationary noisy environments. Especially, the auto control parameter is affected by a linear function associated with an a posteriori signal to noise ratio (SNR) according to the increase or the decrease of the noise level. The proposed algorithm is combined with spectral subtraction (SS) using a hangover scheme (HO) for speech enhancement. The performances of the proposed method are evaluated ITU-T P.835 signal distortion (SIG) and the segment signal to-noise ratio (SNR) in various and highly nonstationary noisy environments and is superior to that of conventional spectral subtraction (SS) using a hangover (HO) and SS using a minimum statistics (MS) methods. 본 논문에서는 비정상 잡음환경에서 음질향상을 위한 새로운 방법을 제안한다. 정상 잡음환경에서 음질향상을 위한 잡음제거 방법으로 주파수 차감법이 잘 알려져 있다. 그러나 실제 잡음환경은 대 부분 비정상적인 특성을 나타낸다. 제안한 방법은 다양한 잡음 과 비정상 환경에서 잘 동작 할 수 있도록 적응 임계 치를 위한 자동제어 파라미터를 사용한다. 특히, 자동제어 파라미터는 a posteriori SNR을 이용한 선형함수를 적용하여 잡음레벨의 증감에 따라 적응 임계 치를 제어한다. 제안한 알고리즘은 음질향상을 위해 Hangover (HO)을 이용한 주파수 차감법과 결합한다. 알고리즘의 성능은 다양한 잡음환경에서 ITU-T P.835 signal distortion (SIG)와 segment signal to-noise ratio (SNR)로 평가하여 (HO)을 이용한 음성검출과 minimum statistics (MS) 방법에 비해 우수한 결과를 나타냈다

      • Performance Improvement of CELP Vocoder Using New Codebook Search Method

        Park, Hochong 광운대학교 신기술연구소 1998 신기술연구소논문집 Vol.27 No.-

        CELP 음성 압축기의 성능을 향상시키는 방법을 제안한다 각 코드북 부프레임에서 최적의 코드 벡터 후보를 다수 구하고. 연속된 두 코드북 부프레임에 대한 코드북 최적화 과정을 통하여 최종의 최적 코드벡터와 이득을 구한다. 이 방법을 이용하면 첫 코드북 부프래임의 최적 코드벡터가 두 번째 코드북 부프레임에 포함되는 미래의 입력에 영향을 받게 되어 향상된 성능을 얻게 된다. 계산량을 조절하기 위한 방법도 제공된다. 모의실험 결과 제안된 방법을 사용한 IS-96A QCELP 음성 압축기가 기존의 QCELP에 비하여 향상된 음질의 합성음을 만들어내었으며, 각 코드복 부프레임에 3개의 후보를 선택할 경우 SNRseg가 0.21dB 향상되었다. A technique to improve the performance of CELP vocoder is proposed. In each codebook subframe, candidates for the optimal codevector are selected, then optimization over two consecutive codebook subframes is conducted to determine the final optimized codevector and gain of each subframe. In this way, optimal codevector selected in the first codebook subframeis affected by the future input in the second codebook subframe without inserting additionala1 gorithmic delay, resulting in Performance improvement. A Procedure to control the computational load is also provided. The simulations show that the IS-96A QCELP vocoder adopting the proposed method produces an enhanced synthesized speech with SNRseg increase of 0.21dB when 3 candidates are used in each codebook subframe compared to the conventional QCELP

      • KCI등재
      • KCI등재

        음질 개선을 위한 새로운 활성함수와 데이터 전처리를 가진 4단계 U-Net 신경망 제안

        김세하,김동회 한국디지털콘텐츠학회 2022 한국디지털콘텐츠학회논문지 Vol.23 No.9

        In this paper, we aim to improve the problem that the original data are removed like noise by mistakenly recognizing the data in the high frequency domain as noise in the prediction process of the existing U-Net neural network. The proposed U-Net neural network identified a specific frequency to block the voice and noise by confirming that the frequency distribution of the noise exists in the upper region compared to the voice, and the improvement in sound quality with the existing U-Net neural network algorithm was achieved by prioritizing preprocessing. In addition, by using a new active function that finds the optimal parameters in the process of updating the weights, it is possible to prevent overfitting and lower the verification loss value. Improvement in sound quality was quantitatively evaluated through evaluation indicators SNR and RMSE. Through the experiment, it was confirmed that the performance of SNR was improved by 50% and RMSE by 30% or more and the verification loss value decreased by 30% by using the new activation function PReLU. 본 논문에서는 기존 U-Net 신경망의 예측 과정에서 고주파수 영역의 음성의 데이터를 잡음으로 잘못 인식하여 원본 데이터가 잡음과 같이 제거되는 문제점을 개선하고자 한다. 제안하는 U-Net 신경망에서는 음성에 비해 잡음의 주파수 분포가 위쪽 영역에 존재하는 것을 확인하여 음성과 잡음을 차단할 특정 주파수을 찾아냈고 그 주파수 이상의 영역을 차단하는 전처리를 우선적으로 거침으로써 기존 U-Net 신경망 알고리즘과의 음질 향상 성능의 개선을 달성할 수 있었다. 또한 가중치가 업데이트되는 과정에서 최적의 파라미터를 찾아가는 새로운 활성함수를 사용함으로써 과적합을 방지하고 검증 손실값을 낮출 수 있었다. 평가지표 SNR, RMSE를 통해 음질의 개선을 정량적으로 평가하였다. 실험을 통해서 SNR은 50%, RMSE는 30% 이상 성능이 개선되었음을 확인하였다. 새로운 활성함수 PReLU를 사용함으로써 검증 손실값이 30%가량 낮아지는 결과를 확인하였다.

      • KCI등재

        손가락 떨림을 이용한 소리전달의 음질 향상에 관한 연구

        박형우,배명진 사단법인 인문사회과학기술융합학회 2017 예술인문사회융합멀티미디어논문지 Vol.7 No.6

        In these days, With the remarkable development of information and telecommunication technology today, it is easy to transfer information through portable information devices. When using mobile devices to transmit information, they are placed in various noisy environments. The noise environment is an environment that interrupts the sound of information by using electronic portable devices. In this case, the signal to noise ratio (SNR) can be obtained by comparing the magnitude of the signal generated by the information device with the magnitude of the noise. In previous studies, it has shown that the minimum SNR required for information transmission is 15 dB. Also in previous studies, we analyze the magnitude and type of environmental noise when using mobile devices has been it. In a quiet environment, the average noise level is less than 50 dB. The average of noisy environments is around 80 dB. This noise occurs the hearing loss. And when using a portable information communication device, the sound generated from the device easily becomes 100dB. A sound of 100dB is a very dangerous sound that harms human hearing. In this study, we propose a method to improve the sound quality by analyzing the size and characteristics of sound when transmitting sound through finger vibration. 오늘날 정보통신 기술의 발전으로 휴대용 정보기기를 통한 정보전달이 손쉽게 이루어진다. 이 휴대기기를 이용해 정보를 습득하는 순간 다양한 소음환경에 놓이게 된다. 소음환경이란 전자기기를 이용해 정보를 청력을 통해 습득할 때 전달을 방해하는 환경이라 할 수 있다. 이때, 정보기기에서 발생시킨 신호의 크기와 소음의 크기를 비교하면 신호 대 잡음비(SNR)를 구할 수 있다. 이전 연구에 의하면 정보전달시 필요한 최소한의 SNR을 15dB이다. 휴대기기를 사용하는 환경소음의 크기와 종류에 대한 이전 연구결과를 보면, 조용한 환경은 평균 소음의 크기가 50 dB 이하이지만, 시끄러운 환경의 평균은 80 dB 가량이다. 이 소리 크기는 사람의 청력을 손상시킬 수 있는 소리크기이다. 그리고 휴대 정보통신 기기를 원활하게 사용하다보면 기기에서 발생한 소리는 손쉽게 100dB에 이른다. 100dB의 소리는 청력 건강을 해치는 매우 위험한 소리이다. 본 연구에서는 이러한 환경에서도 손가락 진동을 통해 소리를 전달하는 경우, 소리의 크기와 특징을 분석해 그 음질을 향상하는 방법을 제안한다.

      • KCI등재

        이동형 단말기를 위한 다채널 입력 기반 비정상성 잡음 제거기

        정상배(Sang-bae Jeong),이성독(Sung-doke Lee) 한국지능시스템학회 2007 한국지능시스템학회논문지 Vol.17 No.7

        잡음의 제거는 음성을 인터페이스로 하는 기기들에 필수적이라고 할 수 있다. 실질적으로 통화 품질이나 음성 인식률은 음성 입력부의 주변에서 들어오는 원치 않는 가산성 잡음에 의해서 크게 열화된다. 본 논문에서는 기본적으로 두 개의 마이크로폰을 이용한 잡음제거 방법을 제안한다. 마이크를 여러 개 사용했을 때의 장점은 방향 정보를 이용할 수 있다는 것인데, 이는 사람 목소리, 음악 소리 등의 비정상성 잡음을 제거하는 데에 유용하다. 제안된 잡음제거 알고리즘은 위너필터에 기반 한다고 볼 수 있다. 위너필터에 의한 잡음제거를 위해서는 검출하고자 하는 음성과 제거하고자 하는 잡음의 주파수 응답이 동시에 추정 가능해야 한다. 이를 위해서 주파수 영역에서 스펙트럼 분류를 시행하여 위너필터 기반의 잡음제거에 필요한 정보를 얻는다. 제안된 알고리즘을 이용한 성능은 잘 알려진 프로스트 (Frost) 알고리즘 및 적응 모드 컨트롤러를 갖는 generalized sidelobe canceller (GSC)와 비교하였다. 성능의 지표로는 객관적 음질 평가의 방법 중에서 널리 쓰이고 있는 perceptual evaluation of speech quality (PESQ) 및 음성 인식률이 사용되었다. Noise cancellation is essential for the devices which use speech as an interface. In real environments, speech quality and recognition rates are degraded by the additive noises coming near the microphone. In this paper, we propose a noise cancellation algorithm using stereo microphones basically. The advantage of the use of multiple microphones is that the direction information of the target source could be applied. The proposed noise canceller is based on the Wiener filter. To estimate the filter, noise and target speech frequency responses should be known and they are estimated by the spectral classification in the frequency domain. The performance of the proposed algorithm is compared with that of the well-known Frost algorithm and the generalized sidelobe canceller (GSC) with an adaptation mode controller (AMC). As performance measures, the perceptual evaluation of speech quality (PESQ), which is the most widely used among various objective speech quality methods, and speech recognition rates are adopted.

      • KCI등재
      • KCI등재

        음향 채널 추정을 이용한 음질 향상

        최영근,박규식,김기만 한국음향학회 2003 韓國音響學會誌 Vol.22 No.7

        최근 원격 회의 시스템에서 마이크로폰 어레이를 이용한 음원 위치 추정 및 음질 향상 기술이 연구되고 있다. 이러한 기술 가운데 대표적인 정합 필터 마이크로폰 어레이는 다수의 마이크로폰을 이용하여 음원의 위치를 추적하고 음원의 방향으로부터 입사되는 신호만을 수신할 수 있도록 한다. 그러나 이는 음향 공간의 기하학적인 형태 및 재질 등을 이용한 모델로부터 미리 계산된 음향 채널을 사용하기 때문에 실제 실내 환경과의 불일치로 인하여 성능이 저하된다. 본 논문에서는 수신된 음향 신호로부터 실내 음향 채널을 추정하고 이를 정합 필터 마이크로폰 어레이에 적용하였다 연구된 방법은 실험을 통해 그 성능을 고찰하였다. Recently, speaker localizing estimation technique has been rising in teleconference systems. In this paper, it was described to be able to enhance the speech quality through microphone array, and received the only signal of speaker. Unfortunately, as it using estimated the signal in advance, it is not matched in a real acoustic environment so it has poor performance. In this paper is proposed for Adaptive Matched Filter Microphone Array that estimated acoustic room environment from the received the signal and study of the efficiency through simulations.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼