2017년 2월 24일 금요일

비정형 엔터프라이즈 시스템의 공통적인 취약점 통합검색 - Google Cloudsearch

엔터프라이즈 시스템 특히 비정형 데이타를 관리하는 시스템의 아킬레스건은 통합검색입니다. 정형데이타는 서버 사이즈를 높히고 CPU나 메모리를 보강하면 상당부분 해결이 되고, 최악의 경우(?) 쿼리문과 인덱스를 조정해서 해결할 수 있으나 비정형데이타(문서, 이메일, 게시판 등)은 뚜렷한 방법이 없습니다. 그래서 문서관리시스템이나 이메일시스템의 3rd party로 도입된 검색엔진 서버는 주기적으로 튜닝을 해야하고 데이타 증가에 따라서 검색속도가 현격히 떨어지는 문제가 발생하게 됩니다.

이것은 검색엔진의 아키텍쳐 문제로 일정량의 데이타까지는 검색이 잘 되지만 한계치 이상이 되면 검색속도가 늦어지게 되고 지속적인 튜닝작업을 해야합니다. 인덱싱 시간도 데이타량에 따라서 상당히 소요가 됩니다.

이번에 구글 G-Suite에서 제공하는 서비스인 클라우드서치는 강력한 검색성능으로 다양한 비정형데이타에 대한 정확하고 빠른 검색을 제공하고 있습니다. cloudsearch.google.com

클라우드 성격상 활용이 보관보다 중요하고, 장소에 상관없이 정보를 검색하는 것이 유리한 기업이라면 도입을 검토해 보는 것이 필요하리라 생각합니다. 구글의 클라우드 서치에는 대용량도 지원하지만 AI 기술이 포함되어 다양한 검색편의 및 빠른 결과를 가져올 수 있습니다.



2017년 2월 23일 목요일

[현장에서] 인간엔 50분 주고, AI에겐 10분 … 뒤끝 남긴 번역 대결

지난 21일 서울 세종대에서 열렸던 인간과 기계의 번역 대결을 놓고 뒷말이 무성하다. 이 대회는 현업에서 활동 중인 전문 번역가 4명과 세 종류의 번역 기계(구글ㆍ네이버ㆍ시스트란)가 주어진 시간 내에 한국어ㆍ영어 지문을 번역하는 대회였다. 심사는 통·번역 전문가들이 ▶정확성 ▶언어 표현력 ▶논리 등 세 가지 항목을 기준으로 평가했다. 총 60점 만점에서 인간 번역가는 49점을 기록하면서 세 기계(28점ㆍ17점ㆍ15점)를 압도했다. 대회를 주최한 세종대 등은 “특정 기계가 몇 점을 받았는지는 밝히지 않겠다”고 설명했다.

주최 측은 또 “단어의 성격과 맥락을 파악하지 않은 기계 번역은 아직 인간을 따라올 수 없다”며 ‘인간의 승리’를 자축했다. “AI 번역은 한 수 아래”, “한국 AI 번역 사업 10년째 허송세월”…. 이날 대결을 전한 기사들은 번역 기계들의 서투른 번역 수준을 일제히 평가절하했다. 그러나 정말 서투른 것은 번역 기계가 아닌 대회를 주최한 세종대와 국제통번역협회였다. 대회가 끝난지 이틀이 지났지만 대회 공정성에 대한 의문과 진행의 미숙함에 대해 질타가 계속 쏟아졌다.

가장 많이 지적받는 부분은 경기 시간이다. 인간 번역가에게는 50분, 인공지능 기계에게는 10분이 주어졌다. 그러나 인공지능 기계는 클릭 한 번으로 모든 번역이 끝난다. 퇴고는 없다. 반면 인간 번역가는 주어진 50분 동안 여러번 글을 고칠 수 있고 인터넷 검색도 할 수 있었다. 차라리 동시 통역사와 인공지능 번역 기계가 맞붙는 것이 좀 더 공정한 대결이지 않을까.
21일 열린 ‘인간 대 AI 번역대결’은 미숙한 진행과 모호한 심사 기준이 논란이 됐다. [뉴시스]
21일 열린 ‘인간 대 AI 번역대결’은 미숙한 진행과 모호한 심사 기준이 논란이 됐다. [뉴시스]

주최 측이 홍보한 것처럼 ‘인간 대 인공지능’ 대결이었는지도 의문이다. 네이버의 번역 서비스 ‘파파고’에는 인공신경망(NMT) 기술이 적용되어 있다. 문맥을 파악해 번역하기 때문에 먹는 ‘밤’과 ‘밤’(night)을 구분할 줄 아는 ‘인공지능’ 기법이다. 그러나 파파고는 아직 베타 서비스 중이라서 200자 이하의 번역에만 NMT 기술이 적용된다. 200자 이상을 번역할 때는 인공지능이 아닌 기존의 통계 기반의 번역(SMT) 방식이 적용된다. 이날 대회에 나온 한글 지문은 모두 600자가 넘었다. 주최 측이 공개한 번역 결과물을 분석한 결과 기존 SMT 방식의 번역 기법이 적용됐다. 기계는 당연히 턱없이 낮은 점수를 받을 수밖에 없었다.

DA 300


심사위원들의 평가 결과도 논란을 부추겼다. 심사를 진행한 곽중철 한국통번역협회장(한국외대 교수)은 “번역기는 문법도 안 맞고 문장도 안 되고 문제가 많다”고 지적했다. “평가를 수치화한 근거를 설명해달라”는 기자들의 요구에 곽 교수는 “점수의 근거는 없지만 원하면 작성해드리겠다”는 납득이 가지 않는 답변을 했다. 번역 기계 점수를 비공개로 부친 것도 이해가 안가는 대목이다. 구글과 네이버 번역 서비스는 일반인들도 온라인으로 이용할 수 있는 서비스다. 주최 측이 공개한 문제만 쳐봐도 어느 기계가 어떤 번역 결과를 내놨는지 즉각 알 수 있다. 비밀로 할 일이 아닌 것이다.

이날 행사장에서의 낯뜨거운 학교 홍보도 문제였다. 신구 세종대 총장은 개회사에서 “세종대와 시스트란은 협력 체계를 구축해 공동 번역하는 작업을 해오고 있다”고 강조했다. 시스트란은 이날 번역 대결에 나온 번역 기기 회사다. 대회 시작전 주최 측과 심사위원들의 포토라인에는 시스트란의 임원도 함께 했다. 대회의 공정성을 생각했다면 세종대와 시스트란 모두 좀 더 신중을 기했어야 했다. 구글과 네이버 관계자는 이날 행사장에 참석하지 않았다. 두 회사 모두 “이같은 대회가 있는지 기사를 보고 알았다”고 말했다. 주최 측이 이날 대회에서 강조하고 싶은 것이 과연 인공지능 번역 기술의 현 주소인지 아니면 세종대와 국제통번역협회 자랑인지 알 도리가 없었다.

하선영 산업부 기자 dynamic@joongang.co.kr

[출처: 중앙일보] [현장에서] 인간엔 50분 주고, AI에겐 10분 … 뒤끝 남긴 번역 대결

2027년 스마트 캠퍼스의 모습은

최근 기술 트랜드 기반하에 이런 변화가 있지 않을까해서 만들었습니다.


1. 로봇 교직원 등장

학교 인포메이션에 사람말을 인식할 수 있는 로봇이 손님 안내 및 학생들 질의에 대답할 수 있습니다. 로봇 뿐만 아니라 스마트폰에서는 챗봇 및 음성 콜센타 기반의 대화도 가능합니다. 궁금하면 말로 물어보세요.


2. 소수의 전산담당자

클라우드 서비스로 학교 서비스가 제공되기 때문에 누구나 쉽게 이용할 수 있고, 전산실에 요청하지 않고 각자가 업무처리를 합니다. 기존의 전산담당자분들은 협업전문가나 코디네이터 역할을 할 수 있습니다. 이제는 모두에게 프로그래밍 능력이 요구되겠죠.


3. 프라임대학 우세

Open course랑 연계하여 다양항 형태의 교육방법이 등장합니다. 현재 KAIST와 코세라에 AI 강좌가 몇개씩 올라와 있을까요? 직접 확인해보세요. 이제는 학교의 위치나 역사보다 학생들이 원하는 콘텐츠를 빨리 만들어서 제공할 수 있는 역량이 중요해 질 수 있습니다. 이미 좋은 강의와 정보는 인터넷에 넘치기 때문이죠.


4. 빅데이타 기반의 학생선발

수능성적보다는 학교의 데이타를 이용하여 공부를 더 잘할 수 있는 요인을 조사하고 이 능력이 있는 학생을 선발합니다. 따라서 학교 특성에 맞는 학생 선발이 가능해집니다.


5. Digital Native족 등장

크롬북, 스마트폰, 아이패드, 노트 9 등 컴퓨터가 아닌 다양한 디지털 기기를 이용하여 학습합니다. 학교 컴퓨터 실습실도 없어지겠네요. 그냥 학생들 입학할때 크롬북 하나씩 사주면 안되나요?


6. 교수님도 마리텔

교수님들끼리 마이크는 어떤거가 좋고 조명은 어떻게 하는지 정보를 교환합니다. 카메라만 있으면 그곳이 강의실입니다. 협업은 온라인으로도 충분합니다. 교수님은 AI 의 도움으로 이해를 못하거나 진도가 느린 학생들을 집중적으로 교육할 수 있습니다.


7. 디지털 콘텐츠의 변신

학교내부의 정적인 정보만 제공하는 시스템 대신에 외부의 다양한 소설 기반의 플랫폼을 이용하여 학교 정보 교환 및 콘텐츠를 저장하고 사용합니다. 학교의 영상이 내부 게시판이 아닌 누구나 볼 수 있는 구글 플러스에 등록이 되고 이 포스팅은 학교 곳곳에서 활용이 됩니다.


8. Flipped learing

배우는 것은 스스로 하고 학교에서는 토론과 협업을 통하여 문제를 해결합니다.


9. 가상환경 수업

수업시간에 프랑스 파리 박물관에 가고, 미국의 그랜드케녁도 갈 수 있습니다. 날씨가 좋으면 달나라도 가봅시다.


10. 얼굴로 출석체크 및 수업이해도 측정

얼굴인식으로 출석체크는 기본. 학생이 관심이 있는지 여부도 확인하고 교사한테 교수방법에 대한 적절한 가이드를 제공합니다. 누가? AI가.




2017년 2월 22일 수요일

가장 흔하게 하는 이메일 실수를 알아봅시다.

이메일은 다양한 SNS가 개발되고 많이 사용해도 매년 10% 증가하는 가장 중요하고 기본적인 커뮤니케이션 수단입니다. 이메일에는 회사의 중요정보가 들어있고, 개인의 역사가 들어있기 때문에 소중히 사용하고 아카이빙(보존)해야 하는 중요한 자료입니다. 예전에는 PST 파일로 개개인이 보관했지만, 이제는 클라우드라는 거대한 공간에 안전하고 보관하고 필요할 때 검색해서 바로 이용해야 합니다.

1. 수신인 지정


    - 받는사람 : 이메일 수취인(개인이나 복수의 사람, 그룹 가능)
    - 참조 : 이메일의 내용을 알아야 하는 사람
    - 숨은참조 : 이메일의 내용을 알아야 하는 사람중에 받는사람이 알지 않았으면 하는 사람

     이메일도 하나의 문서이고 이 문서를 누구에게 보내는 건지 받는사람 리스트에 넣어야 합니다. 그리고 메일 본문에도 맨 앞에 누구에게 보내는 건지 밝혀야 합니다. 참조인은 이메일을 받는 사람이 아니고 알아야 하는 사람을 넣어야하죠. 업무에 관련없는 사람까지 넣는 것은 예절에 벗어나는 행동입니다. 숨은참조에 있는 사람은 받는사람이나 참조인이 볼 수 없습니다. 필요한 경우만 잘 사용해야 합니다.

2. 회신하기
   메일을 받으면 간단하게라도 회신을 합니다. 만약에 자신이 받는사람이라서 회신을 할 경우에 참조인이 있으면 '전체회신'을 눌러야 합니다. 그렇지 않으면 보낸사람에게만 가기 때문에 참조인이나 다른 받는사람에게는 메일 회신이 가지 않아 업무에 혼선이 생깁니다. 지메일에는 세팅에서 지정해 줄 수 있습니다.



3. 대화는 채팅으로
  받은 사람과 참조자가 많을 경우에는 중요내용이 아닌 단순한 내용 및 대화는 개별적으로 채팅으로 해야 합니다. 전헤회신으로 질문하고 답변하면 나중에는 메일 내용을 찾을수가 없어집니다. 채팅을 hangout으로 하면 나중에 대화내용을 검색할 수 있습니다. 내가 카톡으로 보냈나? 문자로 보냈었나? 혼란스러워할 필요가 없어집니다.

4. 답변하기
  회신이 필요없는 메일에 대해서도 수신확인차  '잘 받았습니다', '알겠습니다' 라고 메일을 보내야합니다.


말로 다른 사람에게 이야기하는 것보다 더 힘든것은 글로 전달하는 것입니다. 사회생활이나 학교생활에서 불필요한 오해는 없앨 수 있도록 이메일 사용에 신중을 기해야 하겠습니다.

2017년 2월 16일 목요일

클라우드 시대에서의 맞춥법

옛날에는 사람을 판단하는 기준으로 '신언서판'을 삼았습니다. 용모, 언변, 문필, 판단이죠. 여기서 문필에는 글을 얼마나 반듯하게 쓰는지를 보았지만, 인터넷에서는 글씨체를 확인할 수가 없습니다. 그래서 이 기준은 이제 맞춤법으로 봐야 할거 같네요.

이제는 문서나 이메일을 쓸때 맞춤법은 그 사람을 판단할 때 중용한 기준입니다. 그래서 오히려 예전보다 더 맞춤법을 신경쓰고 조심하고 있습니다. 그런데 구글앱스를 사용해서 자료를 관리할때는 맞춤법에 약간은 고민을 해야 합니다. 테스트를 위해서 아래 3가지 메일을 만들었습니다.



메일 1 : 아버지가 방에 들어가셨습니다.
메일 2 : 아버지 가방에 들어가셨습니다.
메일 3 : 아버지가방에들어가셨습니다.

테스트 1 : '아버지' 검색 -> 1, 2 메일만 검색
테스트 2 : '가방' 검색 -> 2,3 메일만 검색
테스트 3 : '들어가' 검색 -> 검색안됨
테스트 4 : '방에' 검색 -> 1메일만 검색

단순한 테스트이지만, 몇년 지난 메일을 찾을 때 꼭 필요한 고려사항입니다. 한글을 검색할 때에는 형태소(의미있는 단어) 단위로 분석을 해서 그 기준으로 검색을 하는데 띄어쓰기나 중간단어 같은 경우에는 찾기 어려운 경우가 았습니다. 예를 들어 '조재영' 이라는 이름에서 '재영'으로 검색하면 메일을 못찾는 경우도 생길 수 있다는 의미입니다. 그러기 때문에 가끔씩은 검색을 위해서 맞춤법을 약간은 지키지 못하는 경우도 발생할 거 같네요. 메일을 찾아야 하니깐요.

이런 이유로 회사에서 문서 분류를 아주 정확하게 하는 곳에서는 문서 하나에 30개 정도의 태그를 다는 경우도 있습니다. (제약회사의 임상실험결과) 문서나 메일을 작성하면서 나중에 어떤 단어나 키워드로 검색을 할 것인지 생각을 해보고 테스트해서 그 기준에 맞춰서 글을 작성하는 것도 클라우드 시대에는 필요한 작업입니다. 왜냐고요? 클라우드는 용량제한이 없는 무한의 공간이기 때문이죠.

스마트폰으로 지도 리스트를 만들기

다른 사람과 정보를 공유해서 같이 일할때 가장 먼저 떠오르는 것은 문서이지만, 스마트폰의 성능이 좋아져서 위치나 다른 정보도 공유하기가 좋습니다. 오늘 소개해 드릴 기능은 일반 구글계정에서도 사용할 수 있는 기능으로 위치 정보를 공유하는 기능입니다. 

구글 지도는 네이버나 다음 지도에 비해서 협업(Collaboration) 기능이 좋습니다. 즉, 여러명이 같은 지도로 작업을 할 수 있다는 의미입니다. 지도로 어떤 작업을 할 수가 있을까요? 가장 쉽게는 다음과 같이 방송대 지역 지도를 공유할 수 있습니다.


이 방식외에 최근에 기능이 추가되었습니다. 

스마트폰 구글 지도를 실행합니다. https://play.google.com/store/apps/details?id=com.google.android.apps.maps
지명을 입력합니다. 아래에서는 '한국방송통신대'로 검색을 했습니다. 하단에 보면 신기능에 대한 기능 소개가 표시되고 있습니다.


제일 밑에 '새목록'을 선택합니다.

등록하고자 하는 목록 이름을 입력합니다.

'한국방송통신대'로 입력 되었습니다.

'한국방송통신대'로 작성된 목록에 학교 주소를 등록했습니다.

구글 지도에서 다음과 같이 내 장소를 확인할 수 있습니다.
부산지역대학도 추가했습니다. 이런식으로 모든 지역대학과 학습관을 추가할 수 있을겁니다.

물론 공유를 하기 위해서는 공유 옵션을 공개나 공유됨으로 변경해야 할것이고요.
그럼 이 기능을 어디에 사용할 수 있을까요? 고객 리스트를 관리할 수도 있을 것이고, 거래처, 방문해야 할 장소등으로 사용할 수도 있을겁니다. 해당 리스트에서 위치를 선택하고 교통방법을 선택하면 빠른길을 안내해 주겠죠. 사용하다 보면 좋은 아이디어가 나올 거 같습니다.