생성형 AI에 담긴 내 민감 데이터가 위험하다? 오픈AI 해킹 사례로 본 AI데이터 유출 문제점과 방지 대책 > Our Latest Insights

요즈음 IT 업계에서 가장 뜨거운 감자는 뭐니뭐니해도 생성형 인공지능입니다. 그 중 가장 잘 알려진 것은 Chat-GPT죠. 그런데 이를 개발한 오픈AI사(社)가 지난해 해킹을 당하고도 이를 외부에 공개하지 않은 것으로 드러났습니다. 오픈AI는 핵심 기술이 유출된 것은 아니라고 해명했으나 최근 중국발 해커들의 AI 기술 탈취 시도가 잇따르고 있어 AI 기업들의 보안 위협 우려가 커지고 있습니다.

오픈AI 내부 메시지 시스템 해킹으로 드러난 문제점

현지시간으로 지난 4일, 뉴욕 타임즈는 지난해 초 오픈AI의 내부 메시지 시스템에 해킹이 발생하여 관련 메시지가 유출된 사실을 보도했습니다. 해당 해커는 오픈AI 직원들이 최신 기술에 대해 토론하는 온라인 포럼에 접속해 세부 정보를 빼낸 것으로 알려졌지만, GPT를 구축하고 훈련하는 시스템에는 접속하지 못한 것으로 전해졌는데요. 오픈AI측은 바로 이런 이유로 CIRCIA(Cyber Incident Reporting for Critical Infrastructure Act of 2022)를 우회했습니다.

"국가 안보를 위협할 사건이 아닌 것으로 파악되었기 때문에" 사고를 감춰도 아무 문제가 없을 것이라고 판단했습니다. 오픈AI 측은 2023년 4월 임원진들 사이에서만 침해 사고가 있었다고 공지, 대외적으로는 기밀을 유지했습니다. 심지어는 미 연방수사국(FBI)과 중앙정보국(CIA)에도 신고하지 않았습니다. 고객이나 협력업체에 대한 정보를 도난 당하지 않았고, 해커가 외국 정부와는 관련 없는 개인이어서 국가 안보에 대한 위협으로 생각하지 않았기 때문이라는 게 오픈AI의 설명이죠.

Chat-GPT 사용자가 입력한 민감정보를 노리는 해커

사건이 발생한 이후 당시 오픈AI의 기술 프로그램 관리자였던 레오폴드 아셴브레너(Leopold Aschenbrenner)는 미래 인공지능 기술로 인해 피해가 발생하는 것을 막아야 한다는 생각에 임원진들에게 제안서를 발송했습니다.

뉴욕타임즈에 의하면 "회사가 중국 정부와 그 외 여러 해외 적대 세력들의 공격에 대비해 충분한 조치를 취하지 않고 있다"는 비판의 내용도 함께 있었다고 합니다. 실제로 오픈AI의 대표 인공지능 프로그램인 Chat-GPT는 사용자의 증가와 함께 학습 데이터 역시 빠르게 성장, 되먹임을 통해 점점 신뢰성을 향상시키고 있습니다.

이러다보니 사용자들은 Chat-GPT를 신뢰하고 점점 더 민감한 데이터나 중요한 데이터를 입력시키게 되는데요. 비단 민감 데이터를 떠나 데이터의 총량 자체도 상당할 것으로 예상됩니다. 문제는 개발사의 태도입니다. 데이터가 어떻게 수집되고, 어떻게 되먹임되며, 어떻게 모델이 데이터를 취급하는지에 대해서는 철저히 블랙박스 속에 숨겨두고 있습니다.

스타트업/최신 기술 전문 온라인 미디어 기업인 테크크런치(TechCrunch)는 "해킹 자체는 큰 문제가 아닌 것으로 보이지만, AI 회사가 해커의 집중적인 표적 중 하나가 됐다는 것을 상기시켜 준다"고 평하기도 했습니다. AI 데이터의 처리와 수집 과정이 불투명한 과정에서 본격적인 공격 목표가 된다는 것은 자칫하면 더 큰 사고로 이어질 수 있는 가능성이 열리게 되는 것입니다.

쌓여만 가는 대규모 민감 데이터, 규제와 관리 방안은?

이런 상황에서 오픈AI측이 단순히 "국가 안보와 직결되는 사항은 아니다"며 "고객 정보를 도난당하지 않았다"는 변명을 통해 은근슬쩍 넘어가는 것 자체는 큰 문제가 될 수 있습니다. 민감 데이터를 확실히 상당량 보유했을 것으로 추정되는데도 그 데이터에 대한 어떠한 컴플라이언스도, 거버넌스도 적용 받지 않고 있는 상황에서 사건을 은폐하기까지 한 것입니다.

뉴욕타임즈는 이 문제를 공박했습니다. 보도에서는 "AI 기술이 고도로 발전하면서 AI 기술 유출은 국가 안보에 위협이 될 수 있으며, 중국 관련 조직들이 해킹에 나설 수 있다"라고 말했죠. 실제로 중국 해커들은 지난해 5~6월 지나 러몬드 상무부 장관, 니콜라스 번스 주중 미국대사 등의 이메일 계정에 침입했고 국무부에서 이메일 약 6만 건을 다운로드 한 바 있습니다.

이어 지난해 7월에는 중국 해커 조직이 마이크로소프트(MS)의 클라우드 보안을 뚫고 미국 정부 기관을 포함한 약 25개 기관의 이메일 계정에 접근한 것이 알려지기도 했을 정도입니다.

거기다 문제는 또 있습니다. 제안서를 발송한 아셴브레너는 올해 초 해고당했다는겁니다. 조직 내부에 심각한 문제가 있다는거죠. 심지어 그의 제안은 완전히 파기당했죠. 오픈AI 측은 그가 보안성 제고를 위해 제안을 보낸 것과 해고는 별개로 다뤄졌다고 주장하며 인터뷰에서 "아셴브레너의 헌신적 태도에는 감사하고 있지만, 그가 오픈AI의 보안 상태에 대해 가지고 있는 견해에 동의하기는 힘들다. 해당 해킹 사건으로 불거진 문제들은 이미 여러 방면의 노력으로 해결한 상황"이라 주장하고 있습니다.

생성형 AI, 기술 발전 속도만큼 빠르게 커지는 보안 위협

하지만 미심쩍습니다. 아셴브레너는 한 팟캐스트에 출연해 오픈AI가 자신을 '정보 유출 혐의'로 해고했다고 했는데요. 여기서도 회사와 아셴브레너 측의 입장은 팽팽하게 갈리고 있는 상황입니다. 거기다 샘 올트만의 해고와 복귀 과정에서 있었던 오픈AI 내부의 내홍을 생각해본다면 이들의 인공지능 - 블랙박스 - 가 내부적으로 어떤 문제를 겪고 있는지 충분히 짐작할 수 있습니다.

당시 직원들의 요구에 의해 복직하긴 했으나, 임원진들이 샘 올트만을 해고했던 이유는 Chat-GPT 개발과 보안/안전 시스템 구축 과정에서 자기가 원하는 대로 개발 방향을 끌고 가기 위해 임원진들에게 정보를 제공하지 않거나, 거짓 정보를 제공, 혹은 한참 늦게야 정보를 제공하는 등 신뢰받을 수 없는 행동을 했기 때문입니다.

실제 보안 전문 외신 시큐리티위크(SecurityWeek)는 오픈AI 내부의 기업 문화에 대해 지적하며 "인공지능이라는 기술 자체를 어떤 식으로 바라봐야 하는가에 대해 의견이 일치되지 않았다"고 지적한 바 있습니다. 샘 올트만이 빨리 상품화를 시도하면서 도외시한 부분이 있었고, 이런 문제가 아셴브레너의 해고 과정에서 일정 부분 드러났다고도 볼 수 있습니다. 생성형 인공지능은 분명 매력적인 기술입니다.

하지만 겉으로 드러나는 이 매력 뒤에는 무엇이 있을지, 그 블랙박스에 대한 감독이 어떻게 될지 누구도 모르는 상태입니다. 대규모 데이터 집적과 민감 데이터의 수집, 그리고 거기에 보안 위협이 겹치면 초대형 시한폭탄으로 변모할 가능성이 있는 셈이죠. 거기다 오픈AI와 같이 시장을 선도하는 기업이 해킹 사고의 심각성을 자의적으로 판단해 1년 이상 당국의 강한 규제를 우회, 은폐 했었다는 사실이 우려 되는 부분입니다.

대규모 데이터 취급에 필수적인 내부, 외부의 안전장치들

생성형 AI가 아니라 지도학습 AI를 사용하는 eDiscovery는 자료의 수집 과정에서 적법하게 설정된 ESI 가이드라인을 준수해야 하고, 학습 과정에서도 상호 검증받은 전문 변호인단이 검토하는 등 어느 정도의 안전성을 보장하게됩니다.

하지만 이런 생성형 AI는 지금까지 각 사기업들이 너무 많은 권한을 가지고 있으며 제대로 관리조차 되지 않는다고 볼 수 있습니다. 인공지능에 갖춰져야 할 안전장치들에 대한 규정이나 표준, 거버넌스 시스템 등이 제대로 확립되지 않아 각 개발사를 믿을 수밖에 없는거죠. 데이터가 안전하다고 하면, 유출 정황이 있다 하더라도 믿을 수밖에 없게 됩니다. 실제로 오픈AI는 국가 안보에 위협이 되는 사건이 아니었다고 주장했고, 구체적인 증거가 없더라도 당국은 믿는 수밖에 없었죠.

실제로 지금까지 이런 빅테크 기업들은 KADOKAWA의 사건에서 드러났던 것처럼 무의미하게 여겨질 정도로 광범위하고 쓸데없는 부분까지의 사용자 정보를 추적, 수집했습니다. MicroSoft나 구글, META(舊 Facebook)는 이런 데이터를 모조리 모아 정제한 후 표적 광고에 사용했고, 실제 이런 수익 모델을 통해 엄청난 수익을 거두기까지 했습니다. 거기다 여론조작 등의 행위를 가했다는 의혹 역시 제기되고 있죠.

점점 더 많은 데이터가 몇몇 플랫폼으로 집중되는 상황 속에서 보다 투명한 데이터 관리와 검증의 절차와 규범이 확립되고 이를 통해 사용자들이 보다 안전한 환경에서 생성형 AI를 사용할 수 있도록 할 수 있도록 조속히 제도와 규정이 확립되어야 할 것입니다.

인텔렉추얼데이터의 eDiscovery 진행 시 표준화된 규정과 절차를 통해 기업의 민감 데이터를 취급하고 있습니다. 데이터 취급 단계에서 철저한 보안은 물론 내부 구성원에 대한 보안 교육과 훈련을 지속적으로 운영하고 외부 침입을 방지하는 시스템을 갖추고 있어 해킹과 정보 유출에 철저히 대비하고 있습니다. 신뢰할 수 있는 eDiscovery 서비스가 필요하다면 지금 바로 인텔렉추얼데이터의 전문가들과 상담 받아 보세요!

다시 시작된 기아 보이즈의 악몽? 미국 자동차 시장의 특수성과 API 취약점이 만든 새로운 차량 해킹 위협

2022년 8월, 틱톡에서 소위 'Kia Challenge'라며 현대/기아 자동차를 훔치는 것이 유행한 적이 있습니다. 이모빌라이저가 없는 구형 현대/기아 자동차를 노려 도둑질하는 영상이 유행처럼 번진 것인데요. 이런 도둑질을 하는 10대 비행 청소년들은 일명 '기아 보이즈(Kia boys)'라 불리기도 했습니다. 이들에게 특히 현대/기아차가 먹잇감이 되었던 것은 취약한 보안 때문이라는 분석이 있었습니다. '엔진 이모빌라이저' 장치가 없어 쉽게 훔칠 수 있기 때문입니다.엔진 이모빌라이저에서 시작된 기아 보이즈 사태엔진 이모빌라이저는 도난 방지용 시동 제어장치로, 자동차 키를 꽂는 곳에 특정 암호를 저장한 칩을 내장하는 장치입니다. 차주가 이 암호와 같은 번호를 가진 자동차 키를 꽂아야 잠금장치가 해제되고 자동차에 시동이 걸리게 되죠. 유럽연합(EU), 캐나다 등은 차량 내 이모빌라이저 장착을 법으로 의무화했으며, 국내에서 보편적으로 쓰이는 스마트키·버튼 시동 시스템 또한 이모빌라이저 기능을 기본으로 합니다. 하지만 미국에서는 여전히 선택 사항이었고, 구 현대/기아차의 취약점이 노출됐죠.실제 위스콘신주 밀워키에서는 신고가 들어온 도난 차량 가운데 66%가 현대/기아차인 것으로 조사되기도 했는데요. 현대는 부랴부랴 모든 판매 차량에 자체적으로 이모빌라이저를 표준 탑재하기로 했습니다. 하지만 여전히 구버전 차량들에는 문제가 있었죠. 이런 이유로 미국의 대형 자동차보험사 일부는 현대/기아 차량에 대한 보험료를 인상하거나, 아예 신규 보험가입을 거부하기도 했습니다.소프트웨어 업데이트로도 막지 못한 차량 도난이에 대응하기 위해 지난 2월, 현대자동차측은 도난방지 소프트웨어 업데이트를 진행, 미 도로교통안전국(NHTSA) 추산치로 약 830만대 규모의 업데이트를 했지만 무용지물이었습니다. 업데이트 이후 15시간만에 2020년 기아 옵티마(K5)가 도난을 당한 것이죠. 전문가들은 USB 케이블을 이용한 기존 도난 수법이 적용되었다고 분석했습니다.현대자동차 미국 법인측은 보완책으로 보안 키트를 추가로 개발해 고객들에게 제공했습니다. "우리가 제조한 차량은 모든 미국 안전 기준에 부합하거나 초과한다"면서도 "차량 절도 방법을 무력화할 수 있는 새 보안키트를 10월 1일부터 판매하겠다"고 설명했는데요. 하지만 소송은 막지 못했습니다. 미국 내 여러 주에서 현대기아를 상대로 도난사건 발생에 관련해 집단소송이 제기되었죠. 위스콘신을 포함한 7개 주 법원에서는 최근 '설계 결함으로 차량이 도난당했다'며 현대차에 손해배상을 요구하는 소송이 잇따라 제기되었는데요. 현대측은 미국 당국이 요구하는 도난 방지 요건을 갖췄다고 맞섰지만 결국 최대 2700억 원 가량의 현금 보상이라는 합의점에 도달하게 되었습니다.차량 번호만 알면 원격 제어 가능? 새로운 차량 해킹 악몽문제는 현대에게 또 시련이 다가왔다는 겁니다. 차량 번호만 알고 있으면 원격제어가 가능한 희대의 취약점이죠. 지난 26일, 화이트 해커이자 취약점 현상금 사냥꾼 샘 커리는 자신의 유튜브에 '기아툴(Kia Tool)'이라는 커스텀 어플리케이션으로 2022년형 기아 EV6를 해킹하는 모습을 직접 게시했습니다. 어떻게 이게 가능했던 걸까요?그 원인은 취약한 API 구조와 미국 시장의 특수성에 있었습니다. 미국 시장에서 차량 딜러의 권한은 꽤나 큰데요. 우리나라에서 차량을 구매할 때는 자동차 제조 회사에 소속된 영업사원과 대리점에서 상담을 하게 됩니다. 영업사원을 거치는 구조긴 하지만 기본적으로는 자동차 제조 회사에서 직접 고객이 사는 거죠. 고객은 원하는 차에 대한 옵션을 선택하고 대리점에서는 이걸 주문해 주는거죠. 주문대로 공장에서 생산해 주는거고요.하지만 미국은 '딜러가' 원하는 차를 딜러가 미리 주문해서 받고, 그것을 다시 고객에게 파는 시스템입니다. 또 한국과 달리 딜러는 각 주의 DMV(Department of Motor Vehicles)와 협상하여 번호판을 발급해주는 역할도 하는데요. 그러다 보니 권한이 상당히 강력합니다. 고객들 차대 번호만 알고 있으면 고객 개인정보를 모조리 출력해 볼 수도 있고, 차량 소유주의 개인정보를 임의로 변경할 수도 있습니다. 물론 자동차 딜러가 되기 위해선 교육을 이수하고 라이선스를 취득해야 합니다만, 이렇게 잠재적으로 정보가 유출될 수 있다는 것 자체부터 보안 취약점으로 작용할 수 있었습니다. 그리고 그것이 현실로 일어났죠.사물인터넷(IoT) 기능 위한 API에서 발견된 보안 취약점기아자동차 역시 시대에 맞춰 사물인터넷(IoT) 기능을 채택하고 있는데요. 자동차 잠금을 해제하는 등의 원격 작업을 수행하기 위해서는 별도의 WebAPI를 사용해서 통신합니다. 문제는 이 API 서버의 구조였습니다. 앞서 딜러의 역할이 크고 많은 것을 한다고 말씀드렸는데요. 딜러의 세션 키와 VIN, 차대 번호만 알고 있으면 특정 차량의 소유자 정보를 변경할 수 있게 됩니다.문제는 딜러로 가입해서 세션 키를 발급받는 것은 별다른 제약 없이 누구나 할 수 있다는 겁니다. 또 딜러 시스템과 API 서버는 분명히 별개로 분리되어 있었지만, 이 딜러 시스템이 API 서버와 거의 동일한 API 구조로 만들어져 있어서 도메인 앞부분만 변경하면 거의 동일한 결과를 얻을 수 있다는 겁니다. 그래서 공격자는 임의로 딜러 토큰을 생성하고 → 해당 토큰으로 공격 대상 차량의 VIN을 입력해서 개인정보를 받은 뒤 → 차량 소유자 개인정보를 공격자로 변경하고 → 차량 원격 조작 API 서버에 붙어 원격 조작을 수행, 차량을 탈취할 수 있었던 것입니다.그런데 이 취약점이 현대차에만 작동하는 것은 아니었다는 게 문제입니다. 벤츠, BMW, 모든 일본차 브랜드, 심지어 롤스로이스까지 완전히 동일한 방식으로 차량을 탈취할 수 있었던 겁니다. 벤츠의 경우 이 딜러 계정으로 웹 사이트의 소스 코드가 담긴 Git 보관소에 접근할 수 있기까지 했습니다. 이것은 사람에 대한 라이선스 발급과 교육 등으로 안전장치를 만들어 놓았다 하더라도 본질적으로 비지니스 로직 자체가 취약점을 가지고 있고, 가장 약한 취약점 고리가 드러나는 순간 보안 사고가 발생할 수 있다는 것을 잘 보여줍니다.API의 근본적 보안 문제, 기술적인 안전장치 필요해기본적으로 API는 숨길 수 없고, 쉽게 찾을 수 있는 구조입니다. 또한 요즘 차량들은 모두 인터넷에 연결되어 있는 구조라서 공격할 수 있는 방법이 매우 많기도 하죠. 물론 이 취약성은 지난 6월에 발견, 9월 26일에 모두 조치되었음이 확인 및 공개되어서 지금은 사용할 수 없는 방식입니다. 이 방식으로 차량을 탈취당한 피해자도 아직까지는 없었다고 알려져 있습니다. 하지만 이 취약점으로 12개 완성차 브랜드 웹사이트를 해킹할 수 있었했고, 수백만대 차량을 원격 제어할 수 있었습니다.이번 사건에 대해 스테판 새비지 교수는 "스마트폰 지원 기능을 통해 젊은 층에 어필하려는 기업들의 노력이 웹사이트를 통해 차량을 원격으로 제어할 수 있는 취약점을 늘렸다. 이러한 사용자 기능과 클라우드 기능을 휴대폰에 연결하면 생각지도 못했던 것들이 공격이 시작된다"고 말했습니다.많은 기업들이 보안 프로세스를 채택하면서 기술적인 방어만 중시하기도 하고, 업무체계 부분의 방어만을 중시하기도 합니다. 하지만 중요한 것은 항상 보안 취약점은 가장 취약한 연결고리를 끊고 들어온다는 것입니다. 그 고리가 제도 등의 문제로 개선될 수 없다면, 단순히 라이선스를 소유한 사람의 도덕성에 의존하는 것이 아니라 기술적으로도 이중 삼중의 방어장치를 통해 보다 더 꼼꼼한 방어 조치가 수행되어야 할 것입니다.

Oct 18 2024

Company

Insights Insights

전문가들이 분석한 최신 업계 동향과 인사이트를 확인하세요. 전문가들이 분석한 최신 업계 동향과
인사이트를 확인하세요.

생성형 AI에 담긴 내 민감 데이터가 위험하다? 오픈AI 해킹 사례로 본 AI데이터 유출 문제점과 방지 대책

전자증거개시 진행 시 불리한 증거를 고의로 감춘다면?

다시 시작된 기아 보이즈의 악몽? 미국 자동차 시장의 특수성과 API 취약점이 만든 새로운 차량 해킹 위협

제출이 완료되었습니다.

Company

Insights Insights

전문가들이 분석한 최신 업계 동향과 인사이트를 확인하세요. 전문가들이 분석한 최신 업계 동향과 인사이트를 확인하세요.

생성형 AI에 담긴 내 민감 데이터가 위험하다? 오픈AI 해킹 사례로 본 AI데이터 유출 문제점과 방지 대책

전자증거개시 진행 시 불리한 증거를 고의로 감춘다면?

다시 시작된 기아 보이즈의 악몽? 미국 자동차 시장의 특수성과 API 취약점이 만든 새로운 차량 해킹 위협

제출이 완료되었습니다.

전문가들이 분석한 최신 업계 동향과 인사이트를 확인하세요. 전문가들이 분석한 최신 업계 동향과
인사이트를 확인하세요.