【 청년일보 】 구글이나 파파고의 번역 서비스, 애플의 시리와 같은 인공지능 비서, 스팸 메일 필터링 등… 컴퓨터는 사람의 말과 글을 어떻게 이해할까? 그 답은 자연어 처리(natural language processing, NLP)에 있다. 먼저 자연어(natural language)란 우리가 일상생활에서 사용하는 일반적인 언어를 말한다. 인공지능의 한 분야인 자연어 처리는 이러한 자연어를 컴퓨터가 이해하고 조작하도록 돕는 것이다. 앞서 말한 것처럼 우리가 사용하는 text 기반 서비스 중 상당수가 자연어 처리를 이용하고 있다. 이렇게 자연어 처리로 다양한 것들을 할 수 있는데, 그중에서도 관계 추출(relation extraction, RE) 분야에 대해 자세히 알아보자. 간단히 말해서 관계 추출이란, 단어 한 쌍이 주어졌을 때 그 두 단어의 관계가 무엇인지 알아내는 것을 말한다. 예를 들어 “대전은 한국의 도시이다. 나는 거기에 가서 성심당에 들렀다”라는 글이 있을 때, ‘대전’과 ‘한국’의 관계에 대해서는 쉽게 추론할 수 있다. 그러나 대부분 단어들의 관계는 한 문장 내에 있지 않고 여러 문장에 걸쳐서 있다. 위 문장에서 ‘한국’과 ‘성심당’의 관계를
【 청년일보 】 분자의 구조와 구성은 그 분자의 성질에 매우 큰 영향을 미친다. 예를 들어 다이아몬드와 흑연 모두 탄소로 이루어졌지만, 원자 배열이 달라 완전히 다른 물질이 되고, 물(H2O)에 산소 하나만 추가해도 과산화수소(H2O2)로 분자가 바뀐다. 이러한 분자의 고유한 특성을 파악하기 위한 고전적인 방법은 실험실에서 실험을 해보는 것이지만, 직접 실험을 해보는 것에는 한계가 있고, 많은 실험을 한 번에 하긴 어렵다는 단점이 있다. 요즘 다양한 분야에서 적용되고 있는 딥러닝을 이용한다면, 이러한 단점을 해결하여 드라이랩에서의 화학실험이 가능해진다. 기존의 방법과는 다르게 분자 구조를 바라보는 시각 두 가지를 설명한 후, 어떻게 딥러닝을 이용하여 분자의 특성을 파악할 수 있는지 소개해보고자 한다. 딥러닝에 활용하기 위해 분자 구조를 나타내는 방법에는 크게 문자열과 그래프 두 가지가 있다. 먼저 분자 구조를 문자열로 나타내는 방법에는 SMILES(Simplified Molecular-Input Line-Entry System)가 있고, 이는 분자구조를 CC(NC)CC1=CC=C(OCO2)C2=C1과 같은 형식으로 나타낸다. 이러한 문자열로 나타낸 분자 구조
【 청년일보 】 유튜브는 세계에서 가장 큰 동영상 콘텐츠 공유 플랫폼이다. 모바일 마켓 인텔리전스 플랫폼 아이지에이웍스에서 발표한 유튜브앱 분석 리포트에 따르면 우리나라 사람들이 가장 많이 사용하는 앱은 카카오톡을 제치고 유튜브가 차지했다고 한다. 유튜브에 한번 들어가면 추천으로 뜨는 흥미로운 영상들을 보며 몇 시간이 훌쩍 지나가곤 하는데, 이는 바로 우리의 취향을 저격할 만한 영상들을 추천해주는 유튜브의 ‘알고리즘’, 즉 AI 때문이다. 추천 시스템이란 과거 사용자의 시청 기록과 영상에 대한 정보 등 여러 가지 데이터를 이용하여 특정 사용자가 좋아할 만한 영상을 추천해주는 것을 말한다. 우리가 매일 접하는 유튜브도 이러한 추천 시스템을 이용하여 영상을 화면에 노출시킨다. 그 자세한 알고리즘은 2010년, 2016년, 2019년에 유튜브에서 발표한 논문들에 설명되어 있고, 그 논문들에서 설명된 유튜브 알고리즘에 대해 간단히 설명해보도록 하겠다. 먼저, 2016년부터 추천에 딥러닝을 사용함으로써 추천의 성능을 큰 폭으로 높였다고 한다. 딥러닝은 기존의 머신러닝에 인공 신경망(artificial neural network)을 사용하여 학습하는 방식으로 데이터를