인공지능과 환경, 사회, 지배구조(ESG) 리서치

기계독해를 활용한 환경, 사회, 지배구조(ESG) 분석, 어디까지 가능할까요?

2020.05.20
지난해 6월 TCFD(Task force on Climate related Financial Disclosure)는 기후변화 위험과 기회에 관한 보고서 한 편을 출간했습니다. 약 118조 달러(한화 약 143경 원)의 자산을 관리하는 800여 개 공공, 민간 기관이 TCFD의 권고 사항을 지지하고 있는 가운데, “2019 현황 보고서(Task Force on Climate-related Financial Disclosures: 2019 Status Report)”라는 이름의 이 보고서에는 기후변화와 관련한 TCFD의 공시 권고 사항을 기업들이 얼마나 충실히 따르고 있는지 1,000여개 기업을 대상으로 분석한 결과가 실려 있습니다. 특징적인 것은 TCFD는 보고서에서 이러한 공시 분석을 인간이 수행한 것이 아니라, **인공지능이 수행했다고 밝히고 있습니다**.

https://www.fsb-tcfd.org/publications/tcfd-2019-status-report/

특정 텍스트 내에서 원하는 정보를 찾아내거나, 정리하는 인공지능 분야를 “기계 독해(machine reading)”라고 부릅니다. 저희 퀀티파이드이에스지는 텍스트로 구성된 분석 대상 내에서 원하는 정보를 찾아내거나 추론하는 분야인 “기계 독해”가 **실제로 기업 정보 분석에 활용될 수 있는지 확인해 보았습니다**. 2018년 말 구글이 BERT라는 자연어처리 모델을 공개하면서, 자연어처리 인공지능 분야는 새로운 전기를 맞고 있습니다. 지난 2013년 이미지 인식 분야에서 딥러닝이 르네상스를 일으킨 것 처럼, 최근 인공지능에서 가장 발전이 두드러진 분야가 자연어 처리 분야입니다. 최근에는 인간처럼 글을 쓰는 오픈AI의 GPT3까지 발표되는 등 매일 혁명이 일어나고 있습니다. 저희는 구글의 오픈소스 모델인 BERT를 이용하되, ESG 관련 전문용어와 언어습관을 훈련시키기 위해 국내 기업이 발간한 지속가능성보고서 Text를 활용해 미세학습을 진행했습니다. 이렇게 사전 학습된 모델을 전문 분야에 맞게 일종의 커스터마이즈에 해당하는 추가학습을 진행하는 작업을 미세학습(Fine-tuning)이라고 합니다. 실험해본 결과, 저희는 **기업 텍스트에서 자연어 처리를 통해 특정 사실 정보 - 예를 들면 검증 기관의 이름, 제3자 검증의 유무, 보고 기간 및 범위, 온실가스 배출량과 같은 정보들을 매우 정확하게 찾아낼 수 있었습니다**. 아래는 저희가 적용하려고 준비 중인 기계 독해 기술을 활용 예제입니다. (*[링크](http://ml.qesg.co.kr)에서 분석대상 Text에 대한 자연어 질문 처리를 직접 테스트해 보실 수 있습니다.) 긴 문단 내에서 '이슬람 국가로 수출하고 있는 할랄 인증 품목 수'라는 요구 지표를 정확하게 찾아냅니다. 참고로 Text에서 특정 정보 - 할랄 인증 품목 수라는 특정한 지표를 찾아내는 훈련을 한 것이 아니라, 일반적인 질문을 이해하여 정보를 찾아낼 수 있는지 확인한 결과입니다. 즉, 보편적 정보를 찾아낼 수 있도록 일반화된 모델을 만드는 것이 기계독해입니다. 분석대상 텍스트 범위와 찾아내야 할 정보가 명확하다면, 인공지능이 해당 정보를 확인해 줄 수 있습니다. 예를 들어 '갤럭시 S10의 친환경 요소는?', '2019년 LG전자가 보고서를 통해 강조하고자 하는 사항은?'과 같은 다소 넓은 범위의 질의에도 비교적 정확하게 정보를 찾아냅니다.

예시1. CJ제일제당 지속가능보고서 2019

예시2. LG전자 지속가능보고서 2019




##### 시사점 저희가 확인해본 결과처럼 현재 인공지능, 특히 자연어 처리를 통한 기계 독해 기술은 일반적이고 범용적인 방식으로 사용자가 필요로 하는 정보를 비교적 정확히 찾아낼 수 있습니다. 정형화된 정보를 추출해야 하는 인간의 입장에서는 A.I를 통해 대량의 정보에 대한 읽기 부담, 판단의 모호함, 실수를 방지할 수 있게 됩니다. 기업 분석 자동화 시대는 생각보다 빠르게 도래할 수 있습니다. 비재무적 정보를 공개하는 기업 입장에서는, 사람 뿐만 아니라 기계 또한 잠재적 독자로 생각하고 정보를 공개해야 할 것입니다. 점차 자동화되는 기업 분석 과정을 고려하여, **보다 기계 친화적인 공시 방식에 대한 고민도 필요할 것입니다.**

QESG는 복잡한 기업 비재무 정보 거래 한계를 극복하기 위한 솔루션들을 제공합니다. 웹플랫폼 기반 공급망 CSR 평가 및 실사, 비대면 이해관계자 참여(Stakeholder Engagement), 기술 기반 ESG 리포팅(웹 보고서 등), 인공지능 문서분석 기반 기업 ESG 리서치 등 다양한 서비스를 제공하고 있습니다.