기술 지표를 활용한 거래 전략

마지막 업데이트: 2022년 3월 24일 | 0개 댓글
  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
[그림 3] 딥러닝 기반 FDS모델링 사례

기술 지표를 활용한 거래 전략

출처 :

산업통상자원부 「소재ㆍ부품ㆍ장비산업 동향조사」, 한국기계산업진흥회 (www.sobujang.net)

주석 :

* 소재ㆍ부품ㆍ장비 무역통계는 무역협회(관세청)의 HS10단위 품목을 기초로 작성되며, 전산업 수출입 품목에서 소재ㆍ부품ㆍ장비에 해당하는 품목들을 추출하여 국가별/업종별(품목별)로 작성됨
* 국가/업종별 무역통계 등은 KOSIS(주제별 통계 - 광업제조업 - 소재ㆍ부품ㆍ장비산업동향조사)에서 제공

국가통계포털(KOSIS)

- 소재ㆍ부품ㆍ장비산업 생산통계지수
[단위 : 2015=100] 소재ㆍ부품ㆍ장비산업 생산통계지수 통계표 입니다. 단위는 2015=100 입니다. -->
2021
06월
2021
07월
2021
08월
2021
09월
2021
10월
2021
11월
2021
12월
2022
01월
2022
02월
2022
03월
2022
04월
2022
05월
생산지수 118.0 111.4 109.8 108.3 107.0 114.3 117.3 107.7 103.6 114.2 105.1 108.7
출하지수 120.0 110.7 108.2 108.9 108.0 112.9 117.6 106.4 104.1 115.3 106.1 108.9
재고지수 94.9 96.3 100.8 100.2 97.8 101.9 102.9 106.9 106.4 103.7 101.0 101.9

출처 :

산업통상자원부 「소재ㆍ부품ㆍ장비산업 동향지수」, 한국기계산업진흥회 (www.sobujang.net)

주석 :

* 본 통계는 2021년 이후 소재ㆍ부품ㆍ장비를 생산하는 업체를 대상으로 한 월별 표본조사 결과를 활용
* 다만 통계청의 연간 실적 전수조사 결과인 광업제조업조사 품목편 등이 발표되면 소재ㆍ부품ㆍ장비 업종별로 생산, 출하, 재고 등을 통계청 자료에서 추출하여 한국기계산업진흥회가 조사한 월별 조사 결과를 대체 (소재ㆍ부품ㆍ장비 생산 통계는 종업원수 10인 이상 기준)
* 연별 산업통계 등은 KOSIS(주제별 통계 - 광업제조업 - 소재ㆍ부품ㆍ장비산업동향조사)에서 제공

국가통계포털(KOSIS)

○ 통계표 목록

  • 기본통계표: 소재ㆍ부품ㆍ장비산업 무역통계 ( M , 201201 기술 지표를 활용한 거래 전략 ~ 202206 )
  • 기본통계표: 소재ㆍ부품ㆍ장비산업 생산통계지수 ( M , 202001 ~ 202205 )
  • 참고통계표: 소재부품 무역통계 ( M , 199401 ~ 202108 )
  • 참고통계표: 소재부품 무역통계 ( Q , 201501 ~ 202103 )
  • 참고통계표: 소재부품 무역통계 ( Y , 1994 ~ 2021 )

[지표 설명]

1. 지표개념

ㅇ “ 소재 · 부품 ” 이란 상품의 제조에 사용되는 원재료 또는 중간생산물로서 대통령령으로 정하는 것을 말함 . “ 장비 ” 란 소재 · 부품을 생산하거나 소재 · 부품을 사용하여 제품을 생산하는 장치 또는 설비로서 대통령령으로 정하는 것을 말함 .

ㅇ 소재 , 부품 , 장비 는 그 자체로는 상품으로서의 가치를 창출하지 못하고 , 다른 중간재와의 결합을 통해서 그 기능을 발휘할 수 있지만 , 최종재의 경쟁력을 결정하는 핵심요소로 작용

2. 지표의의 및 활용도

ㅇ 지표의 의의 : 소재부품 장비 산업 통계 지표는 소재부품 장비 산업에 대한 현황을 파악하고 소재부품 장비 산업 육성정책의 근거를 마련하기 위해 산업통상자원부가 개발한 통계임 . 해외에서는 공식적으로 소재부품 장비 지표가 없음

ㅇ 지표의 활용도 : ① 소재부품 장비 산업의 생산 , 무역 활동 등 동향과 전망 진단 ② 소재부품 장비 산업의 현황 및 구조 변화 진단 ③ 소재부품 장비 산업 육성정책 수립을 위한 정책연구 ④ 소재부품 장비 업계의 경영전략 수립을 위한 기초 자료 등으로 활용

3. 소재부품 장비 산업 동향

ㅇ 매월 소재부품 장비 산업의 생산 , 출하 , 재고의 변동사항을 조사하여 소재부품장비 산업의 경기변동실태를 파악하기 위한 통계

ㅇ 소재부품 장비 를 생산하는 2, 4 00 개사를 대상으로 실시한 표본조사 결과를 근거로 생산 , 출하 , 재고의 전수를 추정 ( 조사대상 :

< 소재 · 부품 · 장비산업 경쟁력강화를 위한 특별조치법 >시행 규칙 제 2 조 별표 1 의 규정에 의해 한국표준산업분류상 소재부품장비를 생산하는 2, 4 00 개사를 대상으로 조사 )

ㅇ 모집단 정의 : 통계청의 광공업통계조사에 기초하여 한국표준산업 분류상의 KSIC 2 단위 기준으로 [ 13, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ] 에 속하는 산업 중 소재부품 장비 특별법 시행 규칙 제 2 조 별표 1 의 규정에 의한 소재부품 장비 생산업체

ㅇ 생산 , 출하 , 재고는 판매가 기준으로 작성

생산 = 출하 + ( 당월말 재고 - 전월말 재고 )

출하 = 자체 및 수탁 생산한 제품의 총판매액

재고 = 생산된 제품 중 판매되지 않은 제품 ( 계약은 기술 지표를 활용한 거래 전략 되었으나 인도되지 않은 제품 포함 )

ㅇ 계절요인 과 불규칙요인 등이 포함된 원계열 수치

ㅇ 소재부품 장비 산업 동향 지표는 소재부품 장비 산업의 국내경기 동향과 전망 진단에 활용되며 , 이를 토대로 업계의 경영전략 수립과

정부의 정책수립을 위한 기초자료로 활용

4. 소재부품 장비 무역 동향

ㅇ 무역통계는 우리나라와 외국간의 무역 거래에 의한 상품의 수출과 수입 통계 ( 통관기준 )

ㅇ 작성 내용 : 관세청의 보통무역통계의 원시데이터 (HSK 세 번 10 단위 수출입 ) 을 기초로 하여 각 세 번별로 해당 소재부품 장비 를 재배열하여 각 소재부품 장비 별로 다시 재집계하여 품목별 / 국가별로 작성

ㅇ 작성 대상 : 소재부품 장비 산업에 해당하는 1 6 개 업종에 104 개의 세부업종 을 연계하여 산출

ㅇ 물품 분류 : 물품의 분류는 관세법 별표 관세율표상의 HSK 를 사용

ㅇ 수출입 물품에 대한 통계 계상 시점 : 수출입 물품은 신고수리일 , 수입신고 수리전 반출승인 물품은 승인일 , 보세공장 , 보세건설장 및 수출자유지역 반입물품은 사용승인일 기준

ㅇ 소재부품 장비 무역 동향 지표는 소재부품 장비 산업의 수출입 동향과 전망 진단 , 해외 경쟁국과의 거래 내역 파악 , 국제경쟁력 현황 분석 등에 활용되며 , 이를 토대로 업계의 경영전략 수립과 정부의 정책 수립을 위한 기초자료로 활용

회수 전략의 진화?…국내 첫 '셀프 M&A' 성공한 한앤코

경제 2022년 07월 31일 17:40

회수 전략의 진화?…국내 첫

© Reuters. 회수 전략의 진화?…국내 첫 '셀프 M&A' 성공한 한앤코

국내 1위 시멘트기업 쌍용C&E의 경영권을 보유한 사모펀드(PEF) 운용사 한앤컴퍼니가 이 회사 지분 전량을 매각했다. 매각 단가는 투자 원금의 3배. 운용사를 이끄는 10명 안팎의 파트너들은 ‘돈방석’에 앉게 됐다. 매각 차익의 20%에 달하는 수천억원을 보너스로 받게 된다.

대박을 안겨준 새 주인은 연관 대기업도 글로벌 PEF도 아닌 바로 한앤컴퍼니다. ‘헌 펀드’에 있던 쌍용C&E를 ‘새 펀드’로 넘겨 차액을 정산하면서 쌍용C&E 경영권도 계속 행사할 예정이다. 이때 만드는 새 펀드를 컨티뉴에이션 펀드(Continuation Fund)라고 한다. 운용사(GP)는 그대로 두고 투자자(LP)만 바꾸는 딜이다. 글로벌 시장에선 컨티뉴에이션 펀드를 활용한 거래가 성행하고 있지만 한국에선 이번이 처음이다. ○투자자만 바꾸고 경영권은 그대로 31일 투자은행(IB)업계에 따르면 한앤컴퍼니는 15억달러(약 1조9000억원) 규모의 컨티뉴에이션 펀드를 조성해 쌍용C&E 투자자를 교체하는 거래를 지난주 마무리했다. 쌍용C&E 지분 77.68%를 보유 중인 투자목적회사(SPC)의 주주가 기존 한앤컴퍼니 2호 펀드에서 이번에 새로 만든 컨티뉴에이션 펀드로 교체되는 방식이다. 컨티뉴에이션 펀드 중 4억5000만달러는 한앤컴퍼니가 3호 펀드를 통해 재투자했고 5억달러는 콜러캐피털·골드만삭스 등 해외 투자자가, 나머지 5억달러는 미래에셋증권·교직원공제회·농협중앙회 등 10곳 내외의 국내 기술 지표를 활용한 거래 전략 금융회사가 맡았다. 펀드 만기는 5년이다.

쌍용C&E의 기업가치는 주당 8200원, 거래 지분(77.68%) 기준으론 약 3조2093억원으로 책정됐다. 한앤컴퍼니가 지분 확보에 들인 투자금은 약 1조4375억원 수준이다. 배당 등을 통해 그동안 회수한 금액을 고려하면 한앤컴퍼니는 쌍용C&E 투자 6년 만에 3배가량의 차익을 거둔 것으로 추정된다.

한앤컴퍼니는 투자자 교체를 통해 쌍용C&E 경영권을 외부에 매각하지 않고도 중간 회수에 성공했다. 2015년 조성한 2호 펀드가 만기를 앞둔 상황에서 기한에 쫓기지 않고 쌍용C&E 재매각에 돌입할 시간을 벌 수 있는 장점도 있다. 무엇보다 펀드 운용역은 대규모 성과보수를 수령할 수 있게 됐다.

글로벌 PEF업계에선 컨티뉴에이션 펀드가 활발하다. 코로나19 직후 저금리 기조 속에서 PEF로 자금이 몰리면서 펀드 간 거래가 속출했다. 블랙스톤 칼라일 KKR 등 글로벌 PEF들은 컨티뉴에이션 펀드를 보유하고 있거나 펀드 조성을 끝내고 활발히 투자처를 찾고 있다. 파이낸셜타임스에 따르면 세계에서 컨티뉴에이션 펀드를 활용한 거래가 지난해 650억달러로, 코로나19 직전인 2019년(270억달러)의 두 배 이상으로 커졌다. ○3세대 회수시장 진입 기대국내에서도 경기 침체로 인수합병(M&A), 기업공개(IPO) 시장이 위축되면서 컨티뉴에이션 펀드를 활용한 회수 시장이 활성화할 것으로 전망된다. 구조조정 기업의 경영권 매각(1세대), PEF 운용사 간 거래(2세대)에 이어 운용사를 그대로 두고 투자자만 교체하는 ‘3세대’ 회수 시장이 열렸다는 분석도 나온다.

하지만 긍정적으로만 평가되는 것은 아니다. 글로벌 시장에서 경고음이 나오고 있다. 아문디의 빈센트 모티에르 최고투자책임자(CIO)는 지난 6월 “최근 몇 년간 PEF 간 거래들이 민간 시장에서 거품을 만드는 피라미드 다단계 구조와 닮아가고 있다”고 직설적으로 비판했다.

국내에서도 우려의 목소리가 나온다. 한 국내 공제회 CIO는 “글로벌 시장에서 컨티뉴에이션 거래 밸류에이션(기업 평가가치)이 대폭 올라 글로벌 출자계획을 보류했다”고 말했다. 또 다른 연기금 관계자는 “컨티뉴에이션 펀드의 투자 가치가 과연 적정하게 책정됐는지 의문이 제기될 소지가 다분하다”고 말했다.

결국 컨티뉴에이션 1호 딜인 쌍용C&E의 성패에 관심이 쏠린다. 쌍용C&E가 처한 경영 상황이 만만치는 않다. 글로벌 인플레이션 여파로 유연탄 가격이 급등하고 전력요금까지 상승하면서 1분기 영업이익이 작년 동기보다 98% 급감했다. 주가(29일 기준)는 주당 6670원으로 새 투자자들이 인수한 가격 대비 약 18% 낮은 수준에 있다.

한앤컴퍼니도 승부수를 던졌다. 컨티뉴에이션 거래와 함께 쌍용C&E 비상 경영을 선언했다. 또 펀드 관리 보수를 펀드 규모의 1%로 책정하고, 성과보수를 받을 수 있는 최소 수익률 기준도 연 10%로 상향했다. 일반적인 관리 보수 2%와 성과보수 기준 수익률 연 8%보다 낮게 책정한 것이다.

기술 지표를 활용한 거래 전략

오늘날 데이터 과학의 발달은 기술 지표를 활용한 거래 전략 다양한 비즈니스 문제를 해결하는데 도움을 주고 있다 . 예를 들어 , 쇼핑몰에서의 고객 방문 - 구매율을 증가시키거나 , 인터넷 뱅킹에서 사기 거래를 적발하거나 , 대출 포트폴리오의 손실을 예상하고 관리하는 것 등의 중요한 비즈니스 문제를 해결하는 것이다 . 데이터 과학의 기술인 머신 러닝과 딥 러닝을 비롯한 다양한 인공지능 모델들은 이러한 문제들에 제각각 효과적인 솔루션을 제공해가고 있다 . 각각의 방법은 주어진 목표와 제약 조건에 대해 장단점이 있다 . 이번 기사에서는 데이터 사이언스에서 사용하는 가장 일반적인 머신 러닝 기법들과 이들의 성능 평가 지표들을 간단히 개괄적으로 소개한다 .

먼저 , 머신 러닝에 대해서 소개하면 , 명시적인 프로그래밍 ( 정해진 규칙을 통한 프로그램 , 예를 들어서 만일 (IF), 특정 계좌에서의 송금 요청이 이상 ( 두개의 국가에서 비슷한 시간에 접속하기와 같이 ) 하다면 , 그때 (THEN), 소비자에게 경고 알람을 준다 또는 거래를 정지한다 ) 와 같은 정형화된 규칙에 따르는 명령 수행 방식을 통해서가 아닌 데이터로부터 시스템을 학습할 수 있는 인공지능의 한 형태이다 .

머신러닝은 다음 그림과 같은 계보로 분류 된다 .기술 지표를 활용한 거래 전략

그림 1. 머신 러닝 모델의 계보

그림 1. 머신 러닝 모델의 계보

머신러닝의 산출물은 어떤 임무 또는 과업을 수행하는 컴퓨터 프로그램이다 . 머신러닝을 통해 학습된 프로그램은 인터넷에 연결된 아이피 카메라와 연동하여 특정한 물체나 사람을 찾기도 하고(얼굴 인식, face recognition) 자동차에 탑재되어 자율 주행 운전을 수행하기도 한다 . 최근에는 MRI 로 촬영된 폐사진을 분석하여 환부 여부를 분석하여 의사에게 알려주기도 하고 내시경으로 촬영된 용종 사진에 대해서 악성인지 양성인지를 분석하여 의사의 판별에 도움을 주기도 한다 .

아래 그림은 머신러닝의 활용과 학습의 과정을 보여준다.

그림. 머신러닝 학습과 활용도

그림. 머신러닝 학습과 활용도

몇가지 머신 러닝 기법들의 비지니즈 문제 적용 예시들을 들어보자 .

은행에서 일하는 데이터 사이언티스트라고 가정하면 다음과 같은 문제들이 있을 수 있다 .

  • 거래 내역을 바탕으로 대출의 부도 확률 예측하기/ 세분화하기 / 캠페인 효과 예측하기/ 가장 선호할 만한 투자 상품 추천하기

은행의 보안 담당자라면 이상 거래 탐지 문제 또한 머신 러닝으로 풀수 있는 문제이다 .

  • 거래시 정상 거래와 비정상 거래 시도로 분류하여 비정상 거래를 차단하기

이제 , 해당 문제에 적합한 머신 러닝 기법들을 다음의 표와 같이 매핑해보자 .

대출의 부도 확률 예측하기
마케팅 캠페인의 효과 예측하기

회귀 : 수치형 자료 예상 / 예측

비슷한 구매 패턴을 가진 고객 집단 찾아내기 ( 고객 군집화 )

군집화 : 다른 집단의 대상들보다 비슷한 성격을 가진 집단 찾아내기

다른 유사한 고객의 구매를 바탕으로 고객에게 제품 추천하기

최근접 이웃 : 비슷한 특성을 가진 데이터를 바탕으로 새로운 데이터의 특성 예측하기

뷴류 : 이상 ( 비정상 거래 ) 와 정상거래로 분류

* 이상거래 탐지는 편의상 분류 문제로 표기했으나 실제 현업에서는 서비스 개발을 위해서 분류 , 군집화 , 회귀 모형을 종합적으로 적용하고 있으며 , 최근에는 딥러닝 분류 기법을 사용하기도 한다 .

각각의 머신 러닝 알고리즘에 대한 소개와 적용 방법은 추후 연재를 통해서 소개한다 . 본지에서는 최근 등장한 혁신적인 사용자 인터페이스를 기술 지표를 활용한 거래 전략 제공하는 머신러닝, 데이터 마이닝 분석 도구인 Orange3 오픈소스 소프트웨어로 여러 사례에 대한 머신 러닝 알고리즘 적용 및 분석 과정을 연재할 예정이다 .

그림 2. Orange3를 활용하여 보스턴 집값 데이터로부터 머신러닝 알고리즘의 예측 예시도

그림 2. Orange3를 활용하여 보스턴 집값 데이터로부터 머신러닝 알고리즘의 예측 예시도

이제 각각의 비즈니스 문제에 적용되는 머신러닝 알고리즘들을 선택하였으면 해당 머신러닝 모델의 성능을 평가하기 위한 지표들에 대해서 간단히 살펴보자 .

머신 러닝의 성능 평가 지표란 여러가지로 만든 모델을 서로 비교해서 주어진 가설 공간에서 최고의 성능을 발휘하는 최적의 모델을 선택하기 위해 사용되는 지표이다 . 머신 러닝 모델들은 여러 모델 평가 지표를 사용해서 성능을 평가한다 . 각각의 방법은 주어진 목표와 제약 조건에 대해 특징들이 달라지므로 , 종합적으로 판단하는 것이 중요하다 . 다음 그림은 머신러닝에서 사용되는 다양한 성능 평가 지표의 분류 도식이다 .

그림 3. 머신러닝 알고리즘에서의 성능 평가 지표의 분류도

그림 3. 머신러닝 알고리즘에서의 성능 평가 지표의 분류도

간단히 소개하면 다음과 같다 . 기계학습에서 모델이나 패턴의 분류 성능 평가에 사용되는 지표들은 어느 모델이든 간에 발전을 위한 feedback 을 찾아내기 위해서 현재 모델의 성능 (performance) 를 올바르게 평가하는 것에서부터 시작한다 . 모델이 평가해야하는 요소와 그 것을 수치화한 지표들 , 그리고 관련 개념들중 , 회귀 모델과 분류 모델에서의 성능 지표들을 살펴보자 .

< 표 >회귀와 분류 모델의 성능 평가 지표

회귀모델을 평가할 때는 실측값과 예측값의 차 (= 잔차 ) 를 사용한 지표를 사용하는 것이 일반적임

회귀의 평가를 위한 지표는 실제 값과 회귀 예측값의 차이 값을 기반으로 한 지표가 중심이 됨

실제값과 예측값의 차이를 그냥 더하면 잔차의 합은 0 이므로 지표로 쓸 수 없으며 , 이 때문에 잔차의 절대값 평균이나 제곱 , 또는 제곱한 뒤 다시 루트를 씌운 평균값을 성능 지표로 사용하게 됨

분류 모델을 평가하는 요소는 결국 , 모델이 내놓은 답과 실제 정답의 관계로써 정의를 내릴 수 있음 . 정답이 True 와 False 로 나누어져 있고 , 분류 모델 또한 True, False 의 답을 산출함 . 그렇게 되면 , 다음과 같은 2x2 행렬 (matrix) 이 생성됨 . 이 행렬의 값들을 조합하여 아래의 평가지표들을 구성함

기술 지표를 활용한 거래 전략

  • 김동현 선임
  • 승인 2020.12.22 10:30
  • 조회수 5370
  • 댓글 0

대출사기, 보험사기, 보이스피싱 등 국내 금융사기 적발 금액은 지속적으로 증가하는 추세다. 금융기업은 다양한 금융사기에 대한 사전/사후대응을 지원하는 이상거래 탐지 시스템(Fraud Detection System, FDS)을 사용한다. 최근 디지털 기술의 발달로 인해 금융거래 매체의 다양화, 데이터양의 급증, 신종 사기 수법 등의 요인은 FDS를 활용한 금융사기 대처를 더욱 어렵게 함에 따라 정교하고 고도화된 FDS가 요구된다. 최근 FDS는 인공지능을 활용하여 기술 고도화가 진행되고 있다.

[그림 1] 금융사기 피해현황 추이, 감사원 감사보고서(2020.07)]

[그림 1] 금융사기 피해현황 추이, 감사원 감사보고서(2020.07)]

FDS 아키텍처

FDS 구성요소는 크게 정보수집, 이상거래 분석, 대응으로 구성된다.

로그 수집 시스템은 실시간 거래정보를 수집하고 대용량 데이터를 정제하여 이상거래 분석 시스템에 전달한다. 이상거래 분석 시스템은 로그 수집에서 전달받은 데이터와 고객정보, 외부정보를 종합적으로 판단하여 거래이상여부를 판단한다. 대응시스템은 이상거래 분석 시스템이 이상거래라고 판단한 거래에 대해 유형별 대응 시나리오에 따라 사용자 접속차단, 담당자에게 확인 알람 등의 자동화된 시스템 조치를 수행한다. 인공지능 탐지 모델은 새로이 발견된 거래패턴에 대한 내용을 학습하여 성능을 개선하여 이상거래 분석 시스템에 수시로 반영시킨다.

[그림 2] FDS 아키텍처

[그림 2] FDS 아키텍처

FDS 분석 방법

FDS의 분석 방법은 오용탐지(Misuse) 기법과 이상탐지(Abnormaly) 기법, 두 가지로 구분된다.

1. 오용탐지 기법

오용탐지 기법은 기존 이상거래 또는 사기거래에서 나타나는 주요 특징들을 조건화, 규칙화(Rule) 하여 새로이 발생하는 금융거래에 다중 조건(Multi Rule-Based)을 적용하여 필터링하는 방식으로 이상거래 여부를 식별하는 것으로 이해할 수 있다. 이 방식은 빠르고 단순한 기술 지표를 활용한 거래 전략 구조지만, 새로운 패턴에 대응이 어렵다는 단점이 있다.

오용탐지기법 사례는 전문가 집단에 의해 계좌이체 또는 카드 결제 거래와 관련된 것이 대표적이다. 누구나 이상 거래로 인정할 만한 평소에 있을 법하지 않은 이상치(Outlier)에 대해 경고를 하는 방식으로 이해할 수 있다. 예를 들면, 특정 고객이 거래하던 월 평균 금액보다 100배 이상 큰 금액이 새벽시간에 한 번도 거래되지 않았던 계좌에 이체가 된 경우, 금액, 시간, 계좌간 연관성 측면에서 모두 이상치에 속함으로, FDS는 이 거래를 이상거래라고 식별하여 업무 담당자에게 경고를 준다.

2. 이상탐지 기법

이상탐지 기법은 RDBMS에 저장된 고객 기본 정보, 거래 정보 등의 속성(Attribute) 정보를 바탕으로 모델링하여 특이점을 탐지하는 것으로 이해할 수 있다. 이 방식은 복잡한 구조의 데이터를 종합적으로 판단하는 것으로, 발견하기 어려운 이상거래 및 사기거래를 찾아내지만, 실시간으로 처리하기에는 고성능 시스템이 요구된다는 단점이 있다.

이상탐지 기법은 보험금 청구거래 관련 사례가 대표적이다. 고객이 가지고 있는 정적 변수(Static Variable)와 거래정보에 따라 변화하는 동적 변수(Dynamic Variable)를 기본적으로 활용하여 분석하고, 다른 기업에서 관리하는 외부기관에서 참고 가능한 고객 정보를 연계해서 분석한다. 예를 들면, 손해보험사에서는 자동차 고의 사고 보험사기 사례에서 보험금 청구 고객의 ▲고객기본정보와(나이, 성별, 면허취득일 등), ▲상품정보(상품명, 가입특약, 가입일 등), ▲보험금 청구 거래정보(치료병원, 사고장소, 사고일, 청구일, 입원일수, 청구금 등), ▲외부기관 정보(통신사 정보, 신용평가기관, 의료보험 정보 등)를 종합적으로 분석하여 특정 보험금 청구 거래건이 사기일 가능성을 분석(예측)하여 담당자에게 경고를 준다.


FDS 알고리즘

인공지능 기술 기반의 FDS는 인공지능 모델에 금융거래 '전체' 데이터를 주고 이 중에 사기거래가 어떤 것인지 알려주면, 인공지능이 사람이 파악하지 못한 사기 거래 패턴까지 종합적으로 파악하여 새로운 금융거래가 사기패턴과 얼마나 유사한지를 따져 사기거래를 식별한다.

FDS를 위한 인공지능 모델은 대체로 목적변수 Y의 값(Label)이 명확히 기재된 구조화된 데이터(Structured Data)를 학습하는 지도학습(Supervised Learning) 모델 중 이진 분류 예측 모델(Binary 기술 지표를 활용한 거래 전략 Classification Prediction Model)로 분류된다. 이진 분류 예측 모델이란 ‘사기자 맞음’ 또는 ‘사기자 아님’과 같이 예측해야 할 목적변수 값이 두 가지임을 의미한다.

이진 분류 예측 모델의 기본 원리는 로지스틱 회귀(Logistic Regression)로 이해할 수 있다. 로지스틱 회귀는 수치형 데이터 예측 모델인 선형 회귀(Linear Regression) 모델의 결과값에 시그모이드(Sigmoid) 활성함수를 첨가하여 범주형 변수를 예측하는 모델이다. 시그모이드 활성함수란 음의 무한대부터 양의 무한대까지의 실수를 0부터 1사이의 숫자로 변환시켜주는 함수다. FDS에서는 0을 비사기자, 1을 사기자로 치환하여 데이터를 학습시킬 수 있다.

위에서 설명한 로지스틱 회귀 외 사용가능한 지도학습 방법으로 의사결정 나무이 기반 모델이 종종 활용되는데 일반적으로 널리 사용되는 것은 RandomForest, GBM 등이 있다.

딥러닝은 본래 FDS 개발시 잘 활용하지 않는 모델이었지만, 최근 딥러닝을 활용한 다양한 시도에 따른 좋은 결과와 훌륭한 성능을 갖는 모델들이 출시되면서 딥러닝 기반 FDS 연구가 활발히 진행되고 있다. 오랜지라이프는 FDS모델링을 하기 위하여 딥러닝 모델과 로지스틱 회귀 모델, 두 개 모델의 장점을 섞어 사용하는 방식을 소개하고 있다.

[그림 3] 딥러닝 기반 FDS모델링 사례

[그림 3] 딥러닝 기반 FDS모델링 사례

이외로, 인공지능 모델링 방법 중 GAN, KNN 등 비지도 학습 모델을 적용하여 미리 학습되지 않은 패턴에 대해서도 어느정도 정확도를 갖는 학습모델을 설계할 수도 있다. 최근에는 지도학습 및 비지도학습 모델을 적절히 융합한 앙상블(Ensemble) 모델을 사용하기도 한다.


FDS 성능 평가 지표

FDS 모델링에 사용되는 데이터 특징은 목적변수의 구성 비율이 한쪽으로 상당히 치우쳐진 불균형 데이터 (Imbalanced Data)이다. 전체 고객 중에 사기자는 3~4%일 수 있고, 전체 금융거래 중에서 사기거래는 전체 거래 중 0.001%까지 내려갈 수도 있다. 이러한 불균형 데이터들의 성능을 평가할 때는 일반적인 평가 지표인 ‘정확도(Accuracy)’ 와 더불어 이를 보완하는 F1 점수(F1 Score)를 병행하여 사용하여야 한다.

정확도의 함정

극단적인 예를 들자면, 사기자가 전체 고객 중 5%이며, 10,000명의 고객이 있다고 가정하였을 때, FDS가 사기자가 없다고 예측하면 모델의 정확도는 95%가 된다.

한편, 실제 기술 지표를 활용한 거래 전략 사기자 500명 중 절반은 맞추고(A) 절반을 맞추지 못한다면(C) 어떨까? 그래도 여전히 정확도는 95%다.

이러한 정확도가 한계점을 보완하기 위해 F1-Score라는 지표를 사용하게 되는데, 이는 정밀도와 재현도간 조화 평균 산식을 사용한다.
- F1 점수, F1 Score = (2 * Precision * Recall) / (Precision + Recall)
- 정밀도, Precision = A / (A +C) = 250 / (250 + 250)
- 재현도, Recall = A / (A + B)


FDS 탐지성향

다음은 위의 예시와 같은 고객집단에 대해 정확도가 같은 두 가지 FDS 모델이다. 어떤 것이 우수하다고 할 수 있는가?

왼쪽 모델은 사기자가 800명이 있다고 예측하였고, 실제 사기자 500명 중 400명을 맞춘 정확도 95% 모델이며, 오른쪽 모델은 사기자가 400명 있다고 예측하였고 실제 사기자 500중 200명을 맞춘 정확도 95% 모델이다.

위 질문에 정답은 없다. 그 이유는 탐지 대상이 되는 데이터의 특징 및 내부정책에 따라 FDS모델에 적합한 탐지성향은 달라지기 때문이다. 은행의 대출 심사로 예를 들면, 엄격한 기준으로 조금만 이상한 고객이라도 떨어트려 채권 상실 리스크를 최소화 생각이라면 가능한 많은 대상을 사기자로 예측하는 왼쪽 모델이 적합할 것이고, 정말 심각하게 이상한 고객이 아닌 이상 대출을 승인하여 매출액을 증대할 생각이라면 가능한 사기자가 아니라고 예측하는 오른쪽 모델이 적합할 것이다.


FDS 미래

FDS는 인공지능이 적용된 금융기술 중 완성형에 가까운 기술에 속한다. 그럼에도 예측 불가능한 이상거래 및 사기거래를 더욱 완벽하게 식별하기 위한 기술 고도화는 지속적으로 진행되어야 한다

FDS를 비롯한 인공지능을 활용한 모델은 양질의 다양한 데이터 확보 여부 따라 성능 향상을 기대할 수 있다. 향후 데이터 관련 정책으로, 개인정보 비식별 조치에 따른 개인정보 보관 및 데이터 분석에 대한 자유도가 확보되고 마이데이터를 비롯하여 기술 지표를 활용한 거래 전략 동종/이종산업 기업간 데이터 공유가 활성화된다면 FDS는 더욱 높은 탐지 성능을 낼 것으로 기대된다.

POSCO 포스코 ICT

PosFrame(포스프레임)은 생산현장의 정형/비정형 데이터를 실시간으로 수집하여, 데이터에 기반한 분석과 AI를 활용하여 최적으로 제어 할 수 있는 스마트 플랫폼입니다. PosFrame은 중후장대, 연속공정의 세계 최초이자 가장 앞선 플랫폼으로 클라우드 기반으로 제공 가능합니다.

PosFrame 에 관한 이미지입니다. 자세한 내용은 다음에 있습니다.

App 생산 품질 설비 에너지 안전 PosFrame 분석 : Analytics Workbench (AWB) 저장 : Big Data Platform (BDP) 정렬 : Time & Length Alignment (TLA) 처리 : Real Time Platform (RTP) 수집 : Interface Middleware (IFM) 제어 : PosFrame Edge Devices 설비/센서 P/C PLC/ DCS CMS

실시간 데이터 기반 의사결정 지원 체계

다양한 IoT센서에서 발생한 데이터의 실시간 수집-분석-제어 기능을 통하여 데이터기반 의사결정을 지원합니다.

스마트팩토리 IT 신기술 All-In-One 플랫폼

IoT, Big Data, AI 등 IT 신기술 기반의 실시간, 무중단 스마트팩토리 통합 플랫폼으로, 미래 IT 신기술을 지속적으로 적용하고 있습니다.

연속공정에 성공적 적용, 산업 전 분야로 확장

고속 연속공정에서 단위 설비/공정 발생 대용량 데이터를 수평-수직적으로 분석하여 전후(前後)공정 간 추적 분석, 관리가 가능합니다. 생산 소요시간 단축, 품질확보, 설비효율향상, 에너지 최적화, 선제적 안전관리 등 산업 전분야에 활용할 수 있습니다.

1 데이터 수집, 2 데이터 처리 에 관한 이미지입니다. 자세한 내용은 다음에 있습니다.

InterFace Middleware

다양한 이기종 장치와 설비로부터 정형·비정형 데이터를 고속 수집 다양한 이기종 장치와 Interface 연결 대용량의 정형/비정형 Data 수집 데이터 표준변환 및 수집자동화 지원 실시간 고속 수집 (20ms~1s)

Real Time Platform
  • - Factory : 전•후 공정 연계 및 길이 정렬
  • - B&C : 스마트홈, 스마트 빌딩, 스마트 시티 데이터 처리
  • - Energy : 설비 효율 및 성능관련 시계열 정렬

3 데이터 정렬 에 관한 이미지입니다. 자세한 내용은 다음에 있습니다.

Time & Length based Alignment (TLA)

철강연속공정에 특화된 전·후 공정間 Data 연결 조업~품질~설비 데이터 정보 연결 재료단위 계산길이 정보 부여 재료기준 조업/품질이상 추적체계 마련
※ 산업 도메인별 비즈니스 요건에 맞게 맞춤형 개발 적용

Smart Factory Portal 자세히 보기

4 데이터 저장 에 관한 이미지입니다. 자세한 내용은 다음에 있습니다.

Big Data Platform (BDP)

RTP, TLA 정렬 데이터 유형별로 Big Data를 저장하고, 분석 및 활용을 위한 조회엔진 제공 Peta Byte 수준의 대용량, 고성능 Big Data 저장 기존 하둡저장소 대비 10배 압축저장, 성능 2배 향상 대량 정형/비정형 데이터를 저비용, 고효율 저장

5 분석 에 관한 이미지입니다. 자세한 내용은 다음에 있습니다.

Analytics Workbench

분석 전문가가 아닌 현업 담당자도 분석 과정을 One-Stop으로 손쉽게 처리하여 현장을 개선하고 지식 자산화 할 수 있는 AI 분석 솔루션 입니다.

  1. 1. 비전문가도 전문 분석가처럼
  2. 2. 쉽고 빠르게 최신기법 분석
  3. 3. 체계적 모델 관리, 지식 수준 향상
  1. Data 추출
  2. Data 전처리
  3. 탐색적 분석
  4. 분석 모델링
  5. 모델 관리

Analytics Workbench 자세히 보기

6 제어 에 관한 이미지입니다. 자세한 내용은 다음에 있습니다.

PosFrame Edge

PosFrame Edge는 현장 설비 부근에서 실시간 데이터 처리 및 AI, Big Data 모델을 실행하여 속도 지연 없이 설비를 인공지능 제어할 수 있는 솔루션으로 활용 목적에 따라 선택 적용 할 수 있는 핵심기능은 Smart PLC, Data Interface, 분석모델 실행환경 3가지입니다.

  • AI제어
  • Edge컴퓨팅
  • PLC제어
  • 모델 실행 환경(AI, BigData) - PLC/DCS
  • 데이터 수집(수집, 전송) - DAQ
  • Smart PLC(I/O, 제어) - 계측기

제어 에 관한 이미지입니다. 자세한 내용은 다음에 있습니다.

실시간 데이터 수집 계측기, PLC, DCS, DAQ 등으로부터 데이터 수집, 데이터 전처리(계산, 필터링 등) 후 관련 시스템에 기술 지표를 활용한 거래 전략 연결 Smart PLC 기능 제공 소프트웨어 PLC 기능을 활용한 설비 시퀀스 및 프로세스 제어 강화학습 기반의 실시간 모델 제어 제공 실시간 AI, Big Data 제어 모델 실행 및 제어 결과를 활용한 강화학습 등 모델 최적화 환경 지원
※ AI, Big Data 모델 개발 및 성능관리는 PosFrame 을 활용합니다.

PosFrame 부가기능

포탈 (Smart Factory Portal)

스마트 App을 손쉽게 제공하는 앱스토어와 실시간 생산 현황 지표를 한눈에 확인하고 개인 맞춤형 지표, 차트 및 대쉬보드를 제공하는 3D 공장 Layout 을 제공합니다.

Smart Factory Portal 에 관한 이미지입니다. 자세한 내용은 다음에 있습니다.

공장 종합현황 (3D View) 3D형태의 제철소에 필요한 데이터를 배치하여 스마트 공장의 확산모습을 시각화하여 보여줌 스마트 공장으로 drill-down하여 각 공장 별 지표 및 과제 연동 Smart App Store Smart App 확인하고 필요한 앱을 원하는 대로 설치하고 배치하여 활용 My Folder 기능을 활용한 개인별 카테고리 분류 Dashboard 개인별로 활용할 지표 선별 및 배치하여 나만의 Dashboard 관리(배치 차트와 Layout 지정) 차트 Option기능을 통한 유형 및 색상지정


0 개 댓글

답장을 남겨주세요