eDiscovery

Data Analytics Data Analytics

빠르고 합리적인 데이터 분석 기술 빠르고 합리적인 데이터 분석 기술

Data Analytics
고객의 시간과
비용을 절약해주는
AI기반의 문서 검토
지원기술
Active Learning은 머신러닝의 특별한 기법으로 AI가 학습을 시켜주는 사용자(Human Reviewer)와 소통하여 보다 능동적인 방식으로 의사결정 기준점을 찾아가는 기법입니다. 결과의 불확실성을 최소화시키며 관련도 선별 정확도를 높여, 정확한 결과값을 빠르게 도출하는 효과가 있습니다.

주어진 데이터가 어느 범주에 속하는지 판단하는 Binary Classification 모델로서 머신러닝 테크닉 중 한 종류 입니다. 트레이닝 데이터가 패턴 인식 후 두 그룹의 가장가리(서포트벡터)의 경계를 토대로 의사결정을 실행하며, 해당 경계가 모호할 때 시스템이 능동적으로 기준을 찾는 방식입니다.

Technology Assisted Review (TAR)

AI를 기반으로 한 문서 검토 지원 기술입니다. 사용자가 문서를 검토한 결과를 토대로 AI가 관련도 유/무를 판별하는 기준을 학습하고, 관련도가 높을 것으로 예상되는 문서들을 먼저 검토할 수 있게 하는 서비스 입니다.

1
사용자의 문서 구분 및 검토

방대한 양의 문서 중 관련있는 일부
문서를 검토하며 찾고자 하는 문서를
구분합니다.

2
AI의 실시간 사용자 검토 결과 학습

전문가의 Insight를 기반으로 AI는
나머지 데이터에 대한 분석 및 분리를
진행합니다.

3
빠르고 정확한 접근

AI는 실시간 학습을 통해 사용자가
원하는 자료를 분석하여 관련도가
높은 문서를 우선적으로 검토하게
합니다.


TAR을 실현 시키는 Active Learning 이란?
능동적 학습 형태를 갖춘 머신러닝(Machine Learning) 기법

Active Learning은 머신러닝의 특별한 기법으로 AI가 학습을 시켜주는 사용자(Human Reviewer)와 소통하여 보다 능동적인 방식으로 의사결정 기준점을 찾아가는 기법입니다. 결과의 불확실성을 최소화시키며 관련도 선별 정확도를 높여, 정확한 결과값을 빠르게 도출하는 효과가 있습니다.

Active Learning(AL) 적용 방법

Active Learning 기법을 통해 문서를 실시간으로 분석할 수 있으며, 사용자로 하여금 관련도 높은 문서들을 우선적으로 리뷰할 수 있도록 지원합니다.

AL = SVM(Support Vector Machine) 방식의 학습

주어진 데이터가 어느 범주에 속하는지 판단하는 Binary Classification 모델로서 머신러닝 종류 중 하나입니다. 트레이닝 데이터 간의 패턴 인식 후 두 그룹의 가장자리(Support Vector)의 경계를 토대로 의사 결정을 실행하며, 해당 경계가 모호할 때 시스템이 능동적으로 기준을 찾는 방식입니다.

  • 기계학습 분야
  • 패턴인식
  • 모호한 경계 판단
  • 효과적 학습능력

Advanced Analytics

문서의 내용에 포함된 의미, 텍스트, 메타데이터 등을 분석하여 중요도 높은 내용을 찾아내거나 문서간 유사점과 차이점을 식별하는 분석 기술입니다.


Conceptual Analytics

Conceptual Analytics는 문서 내용의 의미를 고려하는 분석 기법으로 단순 키워드 검색이 아닌 문서 전체의 내용을 분석하여 중요 문서를 찾아낼 수 있습니다.

Clustering

비슷한 범주의 그룹으로 문서를 분류하여 많은 양의 문서를 검토할 때 효과적인 기능입니다.

스마트 검색

키워드 검색에서 더 나아가 잘못된 키워드를 수정해 주고 새로운 키워드를 추천하여 검색합니다.

오탈자

“Phillipines 검색 시, Philippines” 검색

동의어

“Student” 검색 시, “Pupil” 검색

지역적 차이

“Coke” 검색 시, “Cola” or ‘Soda” 검색

단어 오사용

“Jive” 검색 시, “Jibe” 검색

Structured Analytics

Structured Analytics는 텍스트 및 메타데이터를 분석하여 같은 세트 안에 들어 있는 문서 간의 유사점과 차이점을 식별합니다.

숫자로 증명하는
eDiscovery의 전문성

150
누적 진행 Case
최근 5년간 진행 건수
50 TB
국내 기업 eDiscovery
누적 데이터
566
법무 검토 전문가 (리뷰어)
네트워크 규모
24년 5월 기준
3
데이터센터 지역
한국, 미국, 대만

Insights

데이터 분석 기술부터 eDiscovery 최신 동향까지 Intellectual Data의 분석 전문가들이 전하는
다양한 칼럼을 통해 가장 최신의 인사이트를 확인해보세요.

eDiscovery
전자증거개시 진행 시 불리한 증거를 고의로 감춘다면?

영미법 상 민사 소송에서 필수적인 절차로 진행하는 전자증거개시 제도, 국내 기업들도 해외, 특히 미국에서 소송을 진행하는 경우가 많아지면서 제도에 대한 관심이 높아지고 있습니다. 국내 소송에서는 존재하지 않는 제도이다 보니 다소 낯설기도 하고, 이해가 안되는 부분도 아직 많는 것 같습니다. 오늘은 그 중에서도 전자증거개시 규정을 어길 경우 발생할 수 있는 일들을 살펴보고자 합니다.​소송 당사자가 스스로 불리한 증거를 공개한다고?국내 소송 기준으로 쉽게 이해 혹은 납득이 안되는 부분은 대부분 스스로 증거를 공개하는 디스커버리의 방식일 것입니다. 국내 민사소송에서는 각 소송 당사자가 자신이 필요로 하는 증거를 직접 수집하여 법원에 제출하지만, 미국 민사소송에서는 각자 자신이 가지고 있는 소송 관련 증거를 스스로 정리해서 제출해야 합니다.물론 제출하는 증거 속에는 당사자에게 유리한 내용도, 불리한 내용도 포함되게 됩니다. 미국 소송 당사자인 양측이 소송에 필요한 모든 정보를 완전히 공개하기 때문에 국내 소송과 달리 증거 수집의 절차와 시간을 단축할 수 있습니다.​만약 불리한 증거를 숨기거나 조작한다면 어떻게 될까?이런 미국 민사소송의 증거 수집을 위한 전자증거개시 절차를 알게 되면 당연한 의문이 하나 들게 됩니다. 증거를 숨기거나 조작할수도 있지 않을까? 하는 의문 말입니다. 특히 전자증거는 종이로 된 서류보다 조작이나 파기가 더 쉽기 때문에 전자증거개시를 회피하고자 하는 유혹이 더 강할 수 있습니다. 만약 진행하는 민사소송이 수백억, 수천억원대 규모라면 더더욱 재판의 결과를 좌우할 증거를 제출하지 않거나 조작하고 싶지 않을까요?물론 미국 법원에서도 소송 중 전자증거개시 규칙을 위반한 사례가 있기는 합니다. 하지만 생각보다 위반 사례가 많은 편은 아니며, 대부분의 전자증거개시 절차는 완전히 투명하게 상호 정보를 공개하는 것이 일반적입니다.고의로 전자증거개시 절차와 규칙을 위반하면? 벌금부터 최대 패소까지!이처럼 전자증거개시를 철저하게 지키는 배경에는 여러가지 이유가 있겠지만, 아마도 가장 큰 이유는 위반 시 아주 강력한 제재(Sanction)가 가해지기 때문일 것입니다. 미국 소송 중 전자증거개시에 관한 규정을 제대로 이행하지 않을 경우 가해지는 제재는 사안의 경중에 따라 매우 다양합니다. 징벌적 벌금 및 상대방 소송 비용에 대한 벌금을 부과하는 제재, 특정 주장 또는 반론을 금지하거나 법원에 증거 관련 사안의 제출을 금지하는 ‘의의/방어 제지’ 그리고 판사가 공식적으로 배심원에게 ‘불리한 사실’로 추정하도록 지시하는 ‘불리한 추정’ 등의 제재가 있습니다. 이 중에서도 가장 강력한 제재는 재판 없이 소송에서 한 당사자가 승소한 것으로 결정하는 ‘궐석 재판’입니다. 이럴 경우 자칫하면 대규모 민사 소송에서 패소하여 막대한 금전적 손해를 입을 수도 있는 것입니다. 이처럼 매우 강력한 법원의 조치가 있기 때문에 대부분의 경우 전자증거개시를 고의로 위반하는 경우는 매우 드문 일입니다. 다만 고의성이 없더라도 증거를 누락하거나 훼손할 경우 제재가 가해질 수 있기 때문에 실제 미국 민사소송 진행에 대한 경험이 풍부한 전문기업과 함께 절차를 진행하는 것이 좋습니다.인텔렉추얼데이터는 지난 5년간 150건 이상의 누적 진행 케이스 경험을 갖춘 전자증거개시 전문기업으로 국내 기업에게 가장 적합한 솔루션과 전문 컨설팅을 제공합니다. 

Data Security
다시 시작된 기아 보이즈의 악몽? 미국 자동차 시장의 특수성과 API 취약점이 만든 새로운 차량 해킹 위협

2022년 8월, 틱톡에서 소위 'Kia Challenge'라며 현대/기아 자동차를 훔치는 것이 유행한 적이 있습니다. 이모빌라이저가 없는 구형 현대/기아 자동차를 노려 도둑질하는 영상이 유행처럼 번진 것인데요. 이런 도둑질을 하는 10대 비행 청소년들은 일명 '기아 보이즈(Kia boys)'라 불리기도 했습니다. 이들에게 특히 현대/기아차가 먹잇감이 되었던 것은 취약한 보안 때문이라는 분석이 있었습니다. '엔진 이모빌라이저' 장치가 없어 쉽게 훔칠 수 있기 때문입니다.엔진 이모빌라이저에서 시작된 기아 보이즈 사태엔진 이모빌라이저는 도난 방지용 시동 제어장치로, 자동차 키를 꽂는 곳에 특정 암호를 저장한 칩을 내장하는 장치입니다. 차주가 이 암호와 같은 번호를 가진 자동차 키를 꽂아야 잠금장치가 해제되고 자동차에 시동이 걸리게 되죠. 유럽연합(EU), 캐나다 등은 차량 내 이모빌라이저 장착을 법으로 의무화했으며, 국내에서 보편적으로 쓰이는 스마트키·버튼 시동 시스템 또한 이모빌라이저 기능을 기본으로 합니다. 하지만 미국에서는 여전히 선택 사항이었고, 구 현대/기아차의 취약점이 노출됐죠.실제 위스콘신주 밀워키에서는 신고가 들어온 도난 차량 가운데 66%가 현대/기아차인 것으로 조사되기도 했는데요. 현대는 부랴부랴 모든 판매 차량에 자체적으로 이모빌라이저를 표준 탑재하기로 했습니다. 하지만 여전히 구버전 차량들에는 문제가 있었죠. 이런 이유로 미국의 대형 자동차보험사 일부는 현대/기아 차량에 대한 보험료를 인상하거나, 아예 신규 보험가입을 거부하기도 했습니다.소프트웨어 업데이트로도 막지 못한 차량 도난이에 대응하기 위해 지난 2월, 현대자동차측은 도난방지 소프트웨어 업데이트를 진행, 미 도로교통안전국(NHTSA) 추산치로 약 830만대 규모의 업데이트를 했지만 무용지물이었습니다. 업데이트 이후 15시간만에 2020년 기아 옵티마(K5)가 도난을 당한 것이죠. 전문가들은 USB 케이블을 이용한 기존 도난 수법이 적용되었다고 분석했습니다.현대자동차 미국 법인측은 보완책으로 보안 키트를 추가로 개발해 고객들에게 제공했습니다. "우리가 제조한 차량은 모든 미국 안전 기준에 부합하거나 초과한다"면서도 "차량 절도 방법을 무력화할 수 있는 새 보안키트를 10월 1일부터 판매하겠다"고 설명했는데요. 하지만 소송은 막지 못했습니다. 미국 내 여러 주에서 현대기아를 상대로 도난사건 발생에 관련해 집단소송이 제기되었죠. 위스콘신을 포함한 7개 주 법원에서는 최근 '설계 결함으로 차량이 도난당했다'며 현대차에 손해배상을 요구하는 소송이 잇따라 제기되었는데요. 현대측은 미국 당국이 요구하는 도난 방지 요건을 갖췄다고 맞섰지만 결국 최대 2700억 원 가량의 현금 보상이라는 합의점에 도달하게 되었습니다.차량 번호만 알면 원격 제어 가능? 새로운 차량 해킹 악몽문제는 현대에게 또 시련이 다가왔다는 겁니다. 차량 번호만 알고 있으면 원격제어가 가능한 희대의 취약점이죠. 지난 26일, 화이트 해커이자 취약점 현상금 사냥꾼 샘 커리는 자신의 유튜브에 '기아툴(Kia Tool)'이라는 커스텀 어플리케이션으로 2022년형 기아 EV6를 해킹하는 모습을 직접 게시했습니다. 어떻게 이게 가능했던 걸까요?그 원인은 취약한 API 구조와 미국 시장의 특수성에 있었습니다. 미국 시장에서 차량 딜러의 권한은 꽤나 큰데요. 우리나라에서 차량을 구매할 때는 자동차 제조 회사에 소속된 영업사원과 대리점에서 상담을 하게 됩니다. 영업사원을 거치는 구조긴 하지만 기본적으로는 자동차 제조 회사에서 직접 고객이 사는 거죠. 고객은 원하는 차에 대한 옵션을 선택하고 대리점에서는 이걸 주문해 주는거죠. 주문대로 공장에서 생산해 주는거고요.하지만 미국은 '딜러가' 원하는 차를 딜러가 미리 주문해서 받고, 그것을 다시 고객에게 파는 시스템입니다. 또 한국과 달리 딜러는 각 주의 DMV(Department of Motor Vehicles)와 협상하여 번호판을 발급해주는 역할도 하는데요. 그러다 보니 권한이 상당히 강력합니다. 고객들 차대 번호만 알고 있으면 고객 개인정보를 모조리 출력해 볼 수도 있고, 차량 소유주의 개인정보를 임의로 변경할 수도 있습니다. 물론 자동차 딜러가 되기 위해선 교육을 이수하고 라이선스를 취득해야 합니다만, 이렇게 잠재적으로 정보가 유출될 수 있다는 것 자체부터 보안 취약점으로 작용할 수 있었습니다. 그리고 그것이 현실로 일어났죠.사물인터넷(IoT) 기능 위한 API에서 발견된 보안 취약점기아자동차 역시 시대에 맞춰 사물인터넷(IoT) 기능을 채택하고 있는데요. 자동차 잠금을 해제하는 등의 원격 작업을 수행하기 위해서는 별도의 WebAPI를 사용해서 통신합니다. 문제는 이 API 서버의 구조였습니다. 앞서 딜러의 역할이 크고 많은 것을 한다고 말씀드렸는데요. 딜러의 세션 키와 VIN, 차대 번호만 알고 있으면 특정 차량의 소유자 정보를 변경할 수 있게 됩니다.문제는 딜러로 가입해서 세션 키를 발급받는 것은 별다른 제약 없이 누구나 할 수 있다는 겁니다. 또 딜러 시스템과 API 서버는 분명히 별개로 분리되어 있었지만, 이 딜러 시스템이 API 서버와 거의 동일한 API 구조로 만들어져 있어서 도메인 앞부분만 변경하면 거의 동일한 결과를 얻을 수 있다는 겁니다. 그래서 공격자는 임의로 딜러 토큰을 생성하고 → 해당 토큰으로 공격 대상 차량의 VIN을 입력해서 개인정보를 받은 뒤 → 차량 소유자 개인정보를 공격자로 변경하고 → 차량 원격 조작 API 서버에 붙어 원격 조작을 수행, 차량을 탈취할 수 있었던 것입니다.그런데 이 취약점이 현대차에만 작동하는 것은 아니었다는 게 문제입니다. 벤츠, BMW, 모든 일본차 브랜드, 심지어 롤스로이스까지 완전히 동일한 방식으로 차량을 탈취할 수 있었던 겁니다. 벤츠의 경우 이 딜러 계정으로 웹 사이트의 소스 코드가 담긴 Git 보관소에 접근할 수 있기까지 했습니다. 이것은 사람에 대한 라이선스 발급과 교육 등으로 안전장치를 만들어 놓았다 하더라도 본질적으로 비지니스 로직 자체가 취약점을 가지고 있고, 가장 약한 취약점 고리가 드러나는 순간 보안 사고가 발생할 수 있다는 것을 잘 보여줍니다.API의 근본적 보안 문제, 기술적인 안전장치 필요해기본적으로 API는 숨길 수 없고, 쉽게 찾을 수 있는 구조입니다. 또한 요즘 차량들은 모두 인터넷에 연결되어 있는 구조라서 공격할 수 있는 방법이 매우 많기도 하죠. 물론 이 취약성은 지난 6월에 발견, 9월 26일에 모두 조치되었음이 확인 및 공개되어서 지금은 사용할 수 없는 방식입니다. 이 방식으로 차량을 탈취당한 피해자도 아직까지는 없었다고 알려져 있습니다. 하지만 이 취약점으로 12개 완성차 브랜드 웹사이트를 해킹할 수 있었했고, 수백만대 차량을 원격 제어할 수 있었습니다.이번 사건에 대해 스테판 새비지 교수는 "스마트폰 지원 기능을 통해 젊은 층에 어필하려는 기업들의 노력이 웹사이트를 통해 차량을 원격으로 제어할 수 있는 취약점을 늘렸다. 이러한 사용자 기능과 클라우드 기능을 휴대폰에 연결하면 생각지도 못했던 것들이 공격이 시작된다"고 말했습니다.많은 기업들이 보안 프로세스를 채택하면서 기술적인 방어만 중시하기도 하고, 업무체계 부분의 방어만을 중시하기도 합니다. 하지만 중요한 것은 항상 보안 취약점은 가장 취약한 연결고리를 끊고 들어온다는 것입니다. 그 고리가 제도 등의 문제로 개선될 수 없다면, 단순히 라이선스를 소유한 사람의 도덕성에 의존하는 것이 아니라 기술적으로도 이중 삼중의 방어장치를 통해 보다 더 꼼꼼한 방어 조치가 수행되어야 할 것입니다.

eDiscovery가 궁금하다면
지금 바로 전문가와 상담하세요.

전문가 자문 받기