        불법스팸 방지를 위한 개선방안 : 정책적 제안을 중심으로

        손종모,임효창 대한산업경영학회 2021 산업융합연구 Vol.19 No.6

        오늘날 이메일(E-mail), 스마트폰, SNS 등의 다양한 정보통신 매체는 정보공유 및 의사소통을 위한 필수품 이다. 하지만 불법으로 수집한 개인정보와 보안에 취약한 기기를 활용하여 대량으로 불법 스팸을 보내거나, 사기에 이용하기 위한 악의적인 공격에 이용되고 있다. 불법스팸과 스미싱, 사기 메일(SCAM) 등은 기업과 사용자들에게 정신적 피로감 등의 사회적 비용뿐만 아니라 IT인프라 자원의 불필요한 소모와 경제적 손실 등 직간접적으로 많은 피해를 주고 있다. 스팸 관련 법제도가 마련되어 있지만 교묘히 회피하여 여전히 기승을 부리고 있고 피해자가 지속 적으로 발생하고 있어 문제점이 없는지 검토가 필요하다. 불법스팸을 차단하고 이로 인한 사기 피해를 예방하기 위해 관련 제도를 개선하는데 기여하는 학술적 연구가 필요한 상황이다. 본 연구는 국내외 법제도와 스팸 관련 대응 활동과 문제점을 도출하고 정책적 개선 방안을 제안하였다. Today, people share information and communicate with others using various information and communication media such as e-mail, smartphones, SNS, etc. However, it is being used in malicious attacks to send a large amount of illegal spam or to use it for fraud by using illegally collected personal information and devices that are vulnerable to security. Illegal spam, smishing, and fraudulent mail(SCAM) cause a lot of direct and indirect damage to companies and users, including not only social costs such as mental fatigue, but also unnecessary consumption of IT infrastructure resources and economic losses. Although there are regulations related to spam, violators of the law are still on the rise by circumventing the law, and victims are constantly occurring, so it is necessary to review what the problem is. This study examined domestic and foreign spam-related regulations and spam-related response activities, identified problems, and suggested improvement countermeasures. Through this study, it was intended to suggest directions for improving spam-related systems in order to block illegal spam and prevent fraudulent damage.

        스팸(SPAM) 규제입법에 대한 평가와 정책방향

        이인호(In Ho Lee) 한국정보법학회 2004 정보법학 Vol.8 No.1

        이 글의 목적은 전자우편광고가 가지는 헌법적 및 사회적 순기능을 전제로 하면서 그 해악을 방지하기 위한 스팸규제입법에 대해 평가하고 그 정책방향을 짚어보는 데에 있다. 이를 위해 아래에서는 우선 스팸 증가의 사회경제적 및 기술적 요인을 간략히 검토하고(II), 다음으로 스팸에 대한 법적 규제를 광고표현의 자유의 관점에서 접근하여 규제의 필요성을 인정하되 그 규제의 한계와 정책방향을 제시한다(III). 이어 비교적 관점을 획득하기 위하여 유럽연합과 미국에서의 스팸에 대한 대응입법의 현황과 그 내용을 간략히 소개한다(IV). 그리고 마지막으로 현행 정보통신망이용촉진 및 정보보호 등에 관한 법률을 중심으로 해서 현행의 규제내용에 관한 몇 가지 문제점을 분석한다(V). 이 글에서 필자가 주장하고자 하는 요지는 다음과 같다. 스팸(spam), 즉 요청하지 않은 전자우편광고(Unsolicited Commercial E-Mail)도 헌법 제21조의 언론출판의 자유(광고표현의 자유)에 의한 보장을 받는다. 물론 허위ㆍ과장ㆍ기만적인 전자우편광고는 보호범위에서 제외된다. 그렇지만 스팸 중에도 헌법이 보호하고자 하는 기능(소비자에 대한 정보전달과 설득기능)을 수행하는 정상적인 스팸은 헌법의 보호를 받고, 따라서 모든 스팸을 불법화해서는 안 된다. 즉 합법적인 스팸과 불법적인 스팸을 구별해야 한다. 또한 누구나 수신자의 전자우편주소를 알고 있다면 “구조적으로” 전자우편함에의 투입이 허용되어 있는 환경에서, 수신자가 요청하지 않은 전자우편광고를 발송하는 것이 그 수신자의 사생활을 곧 바로 침해한다고 할 수 없다. 따라서 정부가 전자우편광고에 대해 opt-in 방식을 채택하여 수신자의 사전 동의 없는 전자우편광고의 발송 자체를 불법화하는 것은 정상적인 스팸발송자의 광고표현의 행사에 지나친 부담을 지우는 것일 뿐만 아니라 전자우편의 구조적 메커니즘에 비추어도 타당하지 않다. 이런 점에서 opt-out 방식을 채택하고 있는 현행법(정통망법; 정보통신망이용촉진및정보보호등에관한법률)의 태도는 적절하다. 다만, 현행법은 (i) 규율범위가 지나치게 포괄적이고, (ii) 정작에 규율대상이 되는 “영리목적의 광고성 정보”에 대한 개념정의가 존재하지 않으며, (iii) opt-out 방식의 규제내용이 조밀하지 못하고, (iv) 악성 스팸행위에 대한 규제가 없다. 그리고 (v) 보다 효과적인 법집행수단을 다양한 차원에서 마련할 필요가 있다. 아울러 (vi) 정부는 네트워크서비스제공자에 의한 자율규제와 기술적 해결방안을 제도적ㆍ정책적으로 뒷받침해주는 데 총력을 기울일 필요가 있다. The present paper purports to evaluate the current regulatory laws on SPAM or UCEM(Unsolicited Commercial Electronic Mail) and present their policy-orientations for the future, on the assumption that the commercial e-mails have some positive functions in the dimension of the socio-economic and constitutional values. The paper covers the following issues: examining the socio-economic and technical factors of the alarming increase in SPAM (II); setting the limits on the SPAM regulations and presenting the policy orientation in the perspective of the freedom of commercial expression while admitting the necessity of regulation (III); introducing and analyzing the regulatory laws on SPAM in the United States of America and European Union (IV); finally, analyzing the current regulatory laws on SPAM in Korea and presenting some feasible improvement alternatives (V). The author sets forth the following essential points. Firstly, a spam as a commercial expression is also under the protection of the freedom of speech clause. It goes without saying that the false or deceptive e-mail messages are put out of the constitutional protection. The constitution, however, guarantees the regular and lawful commercial e-mail messages which have communicative and persuasive functions for consumers. Therefore, it is not appropriate to make every unsolicited commercial e-mail messages illegal. Secondly, under the circumstances of online system in which anyone who get the e-mail address of a recipient is structurally able to send unsolicited e-mail message to the recipient s inbox, it cannot be said that sending unsolicited commercial e-mail to an recipient s inbox violates straight his privacy. Thirdly, the opt-in approach in regulating the spam is not proper and reasonable policy option. The current opt-out approach is appropriate in terms of the online circumstances and the consitutional values of commercial e-mail. Fourthly, the current Act, however, has problems as follows: (i) the Act is too comprehensive in the regulatory scope; (ii) the Act has no definition about the profit-oriented commercial information ; (iii) the regulatory contents of the opt-out approach are lacking in elaboration; (iv) the Act does not contain any regulations on the malignant spam; and (v) the more efficient and effective measures for execution are necessary.

        스팸과 피싱 규제법리의 새로운 전개

        권영설(Young Seol Kwon) 한국언론법학회 2008 언론과 법 Vol.7 No.2

        스팸과 피싱, 특히 스팸광고에 관한 법적 논의는 지난 10년간 일정한 수준으로 전개되어 왔다. 그러나 주로 언론자유 내지는 광고의 자유의 연장선상에서 다루어져 왔다고 보아 크게 틀림이 없겠다. 물론 이 때 헌법적 연관에서 발송자의 자유성 보장에 초점이 모아졌다고 할 것이다. 그러나 이 같은 법적 인식과 분석은 계속적인 스팸량의 비약적 증대와 그로부터 초래되는 개인적 손해와 해악, 특히 천문학적인 사회적 비용에 비추어 스팸수신자의 또 다른 권리보호에도 눈을 돌리지 않을 수 없게 된다. 다시 말해서 스팸규제론이 세계적 추세와 더불어 한국의 경우에도 대두하지 않을 수 없게 된다. 굳이 따지고 볼 때 2004년은 우리의 경우 법과 정책에 있어 적어도 스팸에 관한 한 이를 확실히 “규제의 대상”으로 전환시킨 분기점이었다고 볼 수 있다. 그 결과 스팸과 피싱에 대한 전통적 개념범위의 한정입장은 바뀌지 않을 수 없게 되었고, 스팸개념의 폭은 계속적으로 확대일로에 이르게 되어 그 규제대상의 확장 또한 꾀하게 되고 있다. 바로 이 같은 점에 비추어 규제론 내지 처벌론을 둘러 싼 법적 쟁점과 정책의 문제를 이 글에서 다루어 보고자 하였다. 무엇보다 잠재적 스패머들의 자기억제와 윤리기준의 강화가 먼저 요청된다고 할 것이며, 궁극적으로는 스팸과 피싱의 피해대상자인 소비자들의 이에 대한 인식제고와 반스팸교육의 확대가 당면한 정책과제라 할 것이다. 그러나 이들 모두 당장 기대하기는 어려운 현실조건이라 할 까닭에 반스팸기술의 개발에 일단 의존하지 않을 수 없다. 그러나 반스팸기술의 개발속도가 스패머의 스팸기술에 따라가기 쉽지 않다는 점 또한 고려되어야 할 것인 바, 바로 여기서 요청되는 것이 법과 기술, 그리고 소비자 교육 사이의 종합적 대응력의 제고가 아닐 수 없다. For some time in the past spam had been considered as a mere annoyance to email recipients and a small burden to Internet Service Providers, before revision on the relevant laws were made in Korea in 2004 to start cracking down on spams of malicious nature. Although it is more or less difficult to quantify the spams of this kind, and for that matter phishings too, no one would deny that they are on the rise and their effects are visibly rampant. The writer of the present paper attempts to postulate a new and emerging regulatory legal regime in the light of the proliferating spams in the publicly available networks, since a good many existing principles in information and communication laws do not seem to be tenable any longer. The rationale behind the unsolicited commercial communications, bona fide advertisement on the face, were the freedom of expression in constitutional law perspective. It is to be asserted that one has to take a new look at old principles as they pertain to spam and phishing. A feasible starting point for the present paper has to be the definitional problems on spam including the one like whether or not it is fraudulent, deceptive and offensive. What has been analyzed in ensuing pages were various aspects of socio-economics as they relate to spam and phishing. There are quite a few major technical approaches, namely filtering out inappropriate contents by way of blacklists or white lists. Yet many spammers technologically sophisticated enough to cover their tracks, thus creating dilemma hard to solve. Some of the complexities of the spam and phishing issues, if not all, are deemed to be attributable for the lenient position under the umbrella of free expression. The writer views majority of the spam and phishing as the gateway for cybercriminals, thus warranting a sound and systematic regulatory regime.

        데이터마이닝을 활용한 스팸지수에 대한 스팸 스코어링 개발

        정형철 한국자료분석학회 2013 Journal of the Korean Data Analysis Society Vol.15 No.2

        본 연구에서는 Jeong(2013)의 다음 과정으로 개인의 주관적 총합인 스팸지수로부터 스팸스코어를 산출하는 과정을 다루었다. 새로운 스팸스코어를 산출하는 이유는 가장 먼저 개인의 주관적인 성향에 의해 나타나는 스팸지수를 보다 객관적인 점수로 변경하려는데 있다. 이를 위해, 설문조사로 측정된 스팸 체감지수를 각 변수별로 이산화한 후 로짓모형을 사용하여 스코어카드를 유도하였으며, 스코어카드를 사용하여 개인의 스팸 체감정도를 객관화하였다. 최종적으로 (1) 체감수신량 (2) 스팸 증감체감정도 (3) 심리적 태도에 대한 휴대전화 스팸스코어의 가중치는 15:25:60, 이메일 스팸스코어의 가중치는 30:20:50으로 결정되었다. 즉, 휴대전화에서는 심리적 요인(인지, 감정, 행동)을 강조하고 체감수신량의 가중치를 축소하는 방향으로 스팸스코어가 유도되었으며, 이메일에서는 체감수신량을 강조하고 심리적 요인의 가중치를 휴대전화 스팸스코어보다는 다소 축소하는 방향으로 스팸스코어가 계산되었다. 스팸스코어는 공식통계인 스팸수신량에 대한 보조지표로 활용될 수 있다. In this study, we have developed the spam score using the spam feel receive index which was measured questionnaire was conducted by KISA. The reason for the developing the score cards is that we want make the spam feel receive index with subjective characters to feel spam score with objective characters using the score card. Developing the score card, we use the logit regression with discrete variables after conducting the interactive grouping procedure for the five indicators with continuous attributions. Finally, the cell phone score card has the weights 15:25:36, and e-mail score card has 30:20:50 on the three indicators; (1) feel receive amount (2) variation feel degree (3) psychological attitude including recognition, emotion and behavior, respectively. Spam score could be useful of assistance index helping the official statistics of spam receive amount.

        단어 반복 특징을 이용한 스팸 문서 분류 방법에 관한 연구

        이성진,백종범,한정석,이수원,Lee, Seong-Jin,Baik, Jong-Bum,Han, Chung-Seok,Lee, Soo-Won 한국정보처리학회 2011 정보처리학회논문지B Vol.18 No.5

        인터넷 환경에서 스팸의 범람은 개인 정보의 유출, 피싱에 의한 금전적 손해, 무분별한 유해 콘텐츠의 유통 등 심각한 사회 문제를 야기하고 있다. 또한 사회적 통제를 필요로 하는 유해 정보를 무차별적으로 유통시키는 스팸의 형태와 기술이 갈수록 다양해지고 있다. Bag-of-Words 모델을 이용한 학습 기반 스팸 분류 방법은 현재까지의 연구 중에서 가장 일반적으로 사용되는 방법이다. 그러나 이 방법은 분류 모델 학습 과정에서 사용된 키워드의 출현 정보만으로 스팸 문서를 분류하기 때문에 최근 흔히 발견할 수 있는 스팸 차단 회피 방법에 대한 대처 능력이 부족하다. 본 논문에서는 이러한 문제를 해결하기 위해 문서에서 등장하는 반복 단어의 특징을 이용한 스팸 문서 탐지 방법을 제안한다. 최근 대부분의 스팸 문서에서는 노출하고자 하는 스팸 문구를 반복하는 경향이 있으며, 이는 스팸 문서를 판별하는 기준으로 사용될 수 있다. 본 논문에서는 단어 반복의 특징을 표현할 수 있는 6개의 변수를 정의하고 이를 분류 모델 생성을 위한 속성으로 사용한다. 본 논문에서 제안하는 스팸 탐지 방법의 성능 평가를 위해 블로그 포스트 데이터와 이메일 데이터를 이용하여 기존 방법들과의 비교 실험을 진행하였고, 결과 분석을 통해 제안 방법이 우수함을 확인하였다. In Web environment, a flood of spam causes serious social problems such as personal information leak, monetary loss from fishing and distribution of harmful contents. Moreover, types and techniques of spam distribution which must be controlled are varying as days go by. The learning based spam classification method using Bag-of-Words model is the most widely used method until now. However, this method is vulnerable to anti-spam avoidance techniques, which recent spams commonly have, because it classifies spam documents utilizing only keyword occurrence information from classification model training process. In this paper, we propose a spam document detection method using a characteristic of repeating words occurring in spam documents as a solution of anti-spam avoidance techniques. Recently, most spam documents have a trend of repeating key phrases that are designed to spread, and this trend can be used as a measure in classifying spam documents. In this paper, we define six variables, which represent a characteristic of word repetition, and use those variables as a feature set for constructing a classification model. The effectiveness of proposed method is evaluated by an experiment with blog posts and E-mail data. The result of experiment shows that the proposed method outperforms other approaches.

        EU · 독일의 스팸규제법제 고찰

        김성준 한독사회과학회 2010 한독사회과학논총 Vol.20 No.3

        전 세계적으로 인터넷과 이메일 이용자가 증가하면서 아울러 스팸도 급증함에 따라 심각한 사회문제로 대두되고 있으며, 소비자 신뢰를 훼손함으로써 해킹?바이러스 등 다른 시큐리티 문제와 함께 전 세계적으로 전자상거래 기반을 위협하고 있다. 스팸이 증가하는 주요 이유는 그것이 가장 저렴한 Direct Marketing의 수단으로 사용된다는 점과 온라인 상에서 무차별적으로 이메일을 수집하고 전송하는 기술이 발달했다는 점이다. 이러한 기술의 발달로 인한 스팸의 증가로 인해 다양한 문제가 초래되고 있는 바, 스팸으로 인한 네트워크 과부하, 시간 및 생산성의 낭비 등 막대한 경제적 비용뿐만 아니라, 프라이버시 침해, Identity 도용 등의 문제가 발생하고 있다. 인터넷 이용의 확산과 함께 스팸도 더불어 증가하여 다양한 문제를 야기하자, 각국 정부, 민간단체 및 관련 업계에서는 스팸 문제를 해결하기 위해 다양한 노력을 기울이고 있다. 이하에서는 유럽과 독일의 법?제도적 해결노력을 중심으로 살펴보고, 우리나라의 법 · 제도적 개선방향을 고찰하였다. 물론 스팸은 다양한 문제를 포함하고 있어, 법 제도만으론 해결이 곤란하고 여러 관계자의 종합적인 노력이 필요할 것이다.

      • Improving the Quality of Web Spam Filtering by Using Seed Refinement

        무하마드 아티프 쿠레시,윤태섭,이정훈,황규영,Qureshi, Muhammad Atif,Yun, Tae-Seob,Lee, Jeong-Hoon,Whang, Kyu-Young The Institute of Electronics and Information Engin 2011 電子工學會論文誌-CI (Computer and Information) Vol.39 No.1

        웹 스팸은 중요하지 않은 웹 페이지들의 중요도를 승격시키기 때문에 웹 검색 결과의 품질에 중대한 영향을 준다. 따라서 웹 검색 엔진은 웹 스팸을 제거할 필요가 있다. 웹 스팸 필터링은 스팸 페이지들, 즉 웹 스팸에 기여하는 웹 페이지들을 식별하는 것이며, 잘 알려진 웹 스팸 필터링 알고리즘으로는 Trust Rank, Anti-Trust Rank, Spam Mass, 그리고 Link Farm Spam이 있다. 이러한 알고리즘들의 결과 품질은 입력 시드(input seed)에 따라 달라진다. 따라서 입력 시드를 정제(refinement) 함으로써, 웹 스팸 필터링의 품질을 향상 시킬 수 있다. 본 논문에서는 잘 알려진 네 가지 알고리즘에 대한 시드를 정제하는 기술을 제안한다. 다음으로, 이러한 기술을 원(original) 알고리즘에 각각 적용하는 방법으로 알고리즘을 수정한다. 이를 수정된 웹 스팸 필터링 알고리즘이라고 부른다. 본 논문에서는 또한, 웹 스팸 필터링을 좀 더 향상시키기 위한 전략을 제안한다. 이 전략에서는 수정된 알고리즘들을 수행 순서상의 적절한 위치에 배치함으로써 알고리즘들의 상호간 지원을 통해 전체적으로 성능을 향상시키는 가능성을 고려한다. 마지막으로, 실험에서는 시드 정제의 효과를 보인다. 이를 위해, 먼저, 수정된 알고리즘의 웹 스팸 필터링 품질이 원 알고리즘의 품질보다 더 우수함을 보인다. 다음으로, 웹 스팸 필터링 알고리즘들이 수행되는 순서의 조합 중 가장 성능이 우수한 조합이 가장 뛰어난 잘 알려진 알고리즘과 비교하여 정확도(precision)를 유지하면서 파라미터의 전형적인 값 범위 내에서 재현율(recall)은 최대 1.38배까지 높게 향상됨을 보인다. Web spam has a significant influence on the ranking quality of web search results because it promotes unimportant web pages. Therefore, web search engines need to filter web spam. web spam filtering is a concept that identifies spam pages - web pages contributing to web spam. TrustRank, Anti-TrustRank, Spam Mass, and Link Farm Spam are well-known web spam filtering algorithms in the research literature. The output of these algorithms depends upon the input seed. Thus, refinement in the input seed may lead to improvement in the quality of web spam filtering. In this paper, we propose seed refinement techniques for the four well-known spam filtering algorithms. Then, we modify algorithms, which we call modified spam filtering algorithms, by applying these techniques to the original ones. In addition, we propose a strategy to achieve better quality for web spam filtering. In this strategy, we consider the possibility that the modified algorithms may support one another if placed in appropriate succession. In the experiments we show the effect of seed refinement. For this goal, we first show that our modified algorithms outperform the respective original algorithms in terms of the quality of web spam filtering. Then, we show that the best succession significantly outperforms the best known original and the best modified algorithms by up to 1.38 times within typical value ranges of parameters in terms of recall while preserving precision.

        Improving the Quality of Web Spam Filtering by Using Seed Refinement

        무하마드 아티프 쿠레시(Muhammad Atif Qureshi),윤태섭(Tae-Seob Yun),이정훈(Jeong-Hoon Lee),황규영(Kyu-Young Whang) 大韓電子工學會 2011 電子工學會論文誌-CI (Computer and Information) Vol.48 No.6

        웹 스팸은 중요하지 않은 웹 페이지들의 중요도를 승격시키기 때문에 웹 검색 결과의 품질에 중대한 영향을 준다. 따라서 웹 검색 엔진은 웹 스팸을 제거할 필요가 있다. 웹 스팸 필터링은 스팸 페이지들 즉 웹 스팸에 기여하는 웹 페이지들을 식별하는 것이며 잘 알려진 웹 스팸 필터링 알고리즘으로는 Trust Rank Anti-Trust Rank Spam Mass 그리고 Link Farm Spam이 있다. 이러한 알고리즘들의 결과 품질은 입력 시드(input seed)에 따라 달라진다. 따라서 입력 시드를 정제(refinement)함으로써 웹 스팸 필터링의 품질을 향상 시킬 수 있다. 본 논문에서는 잘 알려진 네 가지 알고리즘에 대한 시드를 정제하는 기술을 제안한다. 다음으로 이러한 기술을 원(original) 알고리즘에 각각 적용하는 방법으로 알고리즘을 수정한다. 이를 수정된 웹 스팸 필터링 알고리즘이라고 부른다. 본 논문에서는 또한 웹 스팸 필터링을 좀 더 향상시키기 위한 전략을 제안한다. 이 전략에서는 수정된 알고리즘들을 수행 순서상의 적절한 위치에 배치함으로써 알고리즘들의 상호간 지원을 통해 전체적으로 성능을 향상시키는 가능성을 고려한다. 마지막으로 실험에서는 시드 정제의 효과를 보인다. 이를 위해 먼저 수정된 알고리즘의 웹 스팸 필터링 품질이 원 알고리즘의 품질보다 더 우수함을 보인다. 다음으로 웹 스팸 필터링 알고리즘들이 수행되는 순서의 조합 중 가장 성능이 우수한 조합이 가장 뛰어난 잘 알려진 알고리즘과 비교하여 정확도(precision)를 유지하면서 파라미터의 전형적인 값 범위 내에서 재현율(recall)은 최대 1.38배까지 높게 향상됨을 보인다. Web spam has a significant influence on the ranking quality of web search results because it promotes unimportant web pages. Therefore web search engines need to filter web spam. web spam filtering is a concept that identifies spam pages- web pages contributing to web spam. TrustRank Anti-TrustRank Spam Mass and Link Farm Spam are well-known web spam filtering algorithms in the research literature. The output of these algorithms depends upon the input seed. Thus refinement in the input seed may lead to improvement in the quality of web spam filtering. In this paper we propose seed refinement techniques for the four well-known spam filtering algorithms. Then we modify algorithms which we call modified spam filtering algorithms by applying these techniques to the original ones. In addition we propose a strategy to achieve better quality for web spam filtering. In this strategy we consider the possibility that the modified algorithms may support one another if placed in appropriate succession. In the experiments we show the effect of seed refinement. For this goal we first show that our modified algorithms outperform the respective original algorithms in terms of the quality of web spam filtering. Then we show that the best succession significantly outperforms the best known original and the best modified algorithms by up to 1.38 times within typical value ranges of parameters in terms of recall while preserving precision.

        문장유사도 측정 기법을 통한 스팸 필터링 시스템 구현

        우수빈(SooBin Ou),이종우(Jongwoo Lee) 한국정보과학회 2017 정보과학회 컴퓨팅의 실제 논문지 Vol.23 No.1

        문자 메시지는 휴대폰을 사용하는 사람들에게 중요한 의사소통의 방법 중 하나이다. 또한 친구맺기 방식이 필요 없이 사용이 가능하기 때문에 이를 악용한 불법 광고 스팸메시지가 기승을 부리고 있다. 최근 스팸 필터링을 위해 기계 학습을 이용한 시스템들이 등장 하였지만 많은 계산을 필요로 하는 단점이 있다. 본 논문에서는 검색할 쿼리를 입력할 때 부정확한 쿼리를 입력하더라도 저장된 데이터베이스와 비교하여 가장 비슷한 단어를 차수 개념을 적용하여 유추하는 집합 기반 POI(Point of Interest) 검색 알고리즘을 이용하여 스팸 필터링 시스템을 구현하였다. 이 알고리즘을 적용하면 서버 컴퓨팅 없이 문자의 조합만을 이용해 쿼리를 유추할 수 있기 때문에 스팸 필터링에 적용하여 입력된 문자메시지가 교묘하게 변형되더라도 스팸이라고 필터링이 가능하다. 또한 문장 유사도 측정 기법을 활용하여 스팸 필터링 성능을 향상시켰으며, 스팸 필터링에 취약한 특정 유형도 걸러내기 위해 특정 전처리 과정을 지원함으로써 대부분의 스팸메세지를 필터링 가능하도록 하였다. 기존 집합기반 POI 검색 알고리즘과 이를 확장 시킨 문장 유사도 측정 기법, 특정 전처리 과정을 추가한 시스템으로 필터링 시스템의 성능평가를 진행하였다. 그 결과 본 논문에서 구현한 시스템이 기존 집합기반 POI 알고리즘과 비교하여 향상된 스팸 필터링 성능을 보여주는 것을 확인하였다. 또한 이동통신사 3사에서 필터링에 취약한 유형이 본 논문에서 구현한 시스템으로 높은 성능으로 필터링이 가능하다는 것을 확인하였다. Short message service (SMS) is one of the most important communication methods for people who use mobile phones. However, illegal advertising spam messages exploit people because they can be used without the need for friend registration. Recently, spam message filtering systems that use machine learning have been developed, but they have some disadvantages such as requiring many calculations. In this paper, we implemented a spam message filtering system using the set-based POI search algorithm and sentence similarity without servers. This algorithm can judge whether the input query is a spam message or not using only letter composition without any server computing. Therefore, we can filter the spam message although the input text message has been intentionally modified. We added a specific preprocessing option which aims to enable spam filtering. Based on the experimental results, we observe that our spam message filtering system shows better performance than the original set-based POI search algorithm. We evaluate the proposed system through extensive simulation. According to the simulation results, the proposed system can filter the text message and show high accuracy performance against the text message which cannot be filtered by the 3 major telecom companies.

        스팸메일로 전파되는 악성코드의 분석 및 대응 프레임워크

        한경수,신윤호,임을규 보안공학연구지원센터 2010 보안공학연구논문지 Vol.7 No.4

        스팸메일은 악성코드를 전파시키는 방법 중의 하나로, 사용자가 스팸메일을 열어보고 첨부파일을 실행하도록 유도하기 위하여 사회공학적인 방법이 주로 사용되고 있다. 본 논문에서는 스팸 메일에 첨부된 악성코드에 대하여 행위 분석과 네트워크 트래픽 분석으로 나누어 분석하고, 분석 결과를 기반으로 대응 프레임워크를 제시한다. 해당 악성코드에 대하여 시스템 내에서의 행위 및 네트워크 트래픽을 분석한 결과, 악성코드에 감염된 시스템 내에서 파일 및 레지스트리를 생성하고 사용자의 키 입력 정보를 파일로 기록(키로깅)하는 것으로 나타났다. 또한 쿠키 파일로부터 추출한 이메일 주소들로 스팸메일을 발송하고, 특정 서버와 지속적인 통신 및 또 다른 악성코드를 다운로드하는 행위를 확인하였다. 또한 분석 결과를 바탕으로 스팸메일을 발송하는 악성코드의 행위와 스팸메일의 특징을 분석함으로써 스팸메일 발송을 탐지하고 차단하기 위한 대응 프레임워크를 제시한다.

