소프트웨어/실용주의 프로그래머 15

구글의 무료 DNS 서버 사용해보기

구글에서 브라우저와 운영체제에 이어 이제 인터넷의 전화번호부 같은 DNS 서비스까지 사업 영역을 넓혔는데요. OpenDNS의 도메인 타이포 수정 같은 다양한 기능을 제공하는 것은 아니지만 기존 ISP에서 제공하는 DNS 속도에 불만이었다면 구글의 DNS 서버 주소를 한번 테스트해 보시는 것도 괜찮을 것 같습니다. (광고 같은 것 생각 안하고 순수한 마음에서 서비스한다고 하니.. –_-) 기본 DNS 서버에 8.8.8.8, 보조 DNS 서버에 8.8.4.4를 각각 입력해 주면 되네요. 제대로 적용이 되었는지 확인하려면 명령 프롬프트에서 ipconfig /flushdns 입력 후 nslookup으로 아무 웹사이트를 찾아봐서 구글의 도메인 서버 정보가 나오는지를 체크해보면 됩니다. 아래는 TechSutra라는..

최고의 영어공부 사이트 EnglishCentral.com

지인의 소개의 알개된 정말 멋진 영어공부 사이트 http://EnglishCentral.com 을 소개 합니다. 얼마전 Google Ventures의 투자를 받아서 유명해 졌죠. http://www.englishcentral.com/en/static/about ( 회사 소개 및 투자자 안내) 직접 써 보니까 정말 쉽고 재미있게 잘 만들어졌습니다. 기본적인 기능은 매우 간단합니다. 동영상을 보면서 문장을 따라 읽는 것이죠. [다양한 동영상] Business, Music, Technology, Travel 등 다양한 종류의 동영상이 준비 되어 있고 사용자의 요청을 받아서 계속 추가되고 있습니다. "Stay Hungry, Stay Foolish"로 유명한 스트비잡스의 스탠포드 대학교 졸업축사도 있네요. [정말..

주중에 쓰는 언어, 주말에 쓰는 언어

Stack Overflow는 프로그래밍에 관련된 질문과 답변을 할 수 있는 웹사이트입니다. 네이버 지식인의 "내공" 비슷한 시스템과 잘 정리된 태그 기능을 가지고 있습니다. 흥미롭게도 Stack Overflow는 사용자들이 제공한 모든 컨텐트를 Creative Commons 라이센스로 공개하고 있습니다. 사용자들이 만들어낸 데이터를 꿀꺽하려는 어떤 웹사이트와는 비교되는 모습입니다. 이 데이터를 가지고 Dan Lorenc라는 사람이 요일별로 Java, C#, Python, Ruby 태그를 단 질문의 갯수가 어떻게 변하는지 통계를 냈습니다. Java와 C# 질문의 수는 주말이 되면 눈에 띄게 감소하고, Python과 Ruby 질문의 수는 증가하고 있습니다. 출처 : http://kldp.org/node/10..

글쓰기가 두려운 직장인을 위한 조언

얼마 전 올 들어 두 번째 ‘AhnLab R&D School’이 열렸다. '연구원의 Power Writing'이라는 제목으로 '한국의 이공계는 글쓰기가 두렵다’, ‘한국의 직장인은 글쓰기가 두렵다’의 저자 임재춘 교수가 강의했다. 임교수는 우리가 글을 못 쓰는 이유가 무엇인지를 가지고 말문을 열었다. 글은 크게 재미와 감동을 주는 문학적 글과 실용적 글로 나눌 수 있는데, 우리나라 교육은 재미와 감동을 주는 글짓기에 치중하여 효과적인 의사 전달에 중점을 두는 실용적 글짓기의 교육이 부족하다는 것이다. 이어서 효과적인 의사 전달을 위한 구조와 논리를 갖춘 글쓰기인 힘 글쓰기(Power Writing)와, 이를 토대로 기술 글쓰기(Technical Writing)를 잘할 수 있는 방법을 소개했다. 그에 따르..

에반젤리스트(Evangelist)는 뭐하는 사람?

MS 에반제리스트에 블로그들..... ---------------------------------------------------------------------------------- 제가 고객분들과 만나 처음 명함을 교환할 때 항상 듣는 말, 에반젤리스트가 뭐죠? 에반젤리스트를 번역하면 "전도사", "전도자"라고 할 수 있을 것입니다. 문득 기독교의 전도사가 머리에 떠오르십니까? 어원은 같지만 그 쓰임새는 많이 다릅니다. IT 분야에서는 우리말로 별도로 번역하지 않고, 그냥 에반젤리스트라고 부르는 것이 좋을 것 같습니다. 저는 "해당 기술에 대한 열정을 가지고 플랫폼, 제품, 서비스의 가치를 전달하는 사람"이라고 정의를 내리고 싶습니다. 검색 엔진에 에반젤리스트를 입력하면 나오는 결과 값을 보면 야후..

형태소 분석기에 유니코드 모듈 추가

운동하고 집에와서 잠시 게임으로 긴장을 풀어준 다음에 바로 코딩에 들어갔다. 간만에 하는 C언어 코딩이지만 풋~~~ 역시나 나름의 맛이 있는거 같다. ㅎㅎ 오랜만에 형태소 분석기 코딩을 하는 이유는.....???. typos님 께서 공개된 형태소 분석기가 필요하다고 해서 썩혀 두려고 한 분석기 소스를 오랜만에 훓어 보았다. 게다가 역방향 복합명사 분해 알고리즘을 실제 적용해 보고 싶은 욕구가 불끈 솥아 올랐던것도 한몫 하기도 했다.(물론 Lucene에 붙이기 위해서이지만 14만 한국어 사전의 취약점 때문에 굉장히 망설였다.) 일단 Lucene이 유니코드 기반의 문자셋을 이용하니 그동안 완성형, 조합형 기반의 분석기 소스에 유니코드 변환 모듈을 넣을 필요가 있었다. iconv라는 라이브러리를 쓰려고 했지만..

형태소 분석기 0.9.1 배포 및 라이센싱

형태소 분석기에 대한 다양한 문의가 오고, 몇몇 분들이 라이센스에 대한 문의를 해주셔서 이를 정리하고자 한다. 정리하면서 몇 가지 이상한 분석 결과를 만들어내는 것들을 수정해서 재배포 한다. 1. Korean Morpheme Analyzer V0.9.1 by therocks. 이전 버젼들은 모두 삭제해서 지금 올라가는 것을 사용하는 것을 권장한다. org.snu.ids.ha.zip * 수정된 점 1) 부정확한 띄어쓰기 추가 개선 '검색서비스를' 과 같은 문장을 처리할 때, 속도를 향상시키기 위해서 앞부분에서 적당히 검색결과가 나오면 띄어쓰기 처리를 해주고 다음 문자열들을 처리하도록 하였는데, 검색(명사)+서(조사)+[ ]+비(명사) 가 되는 순간 잘라버려서 서비스가 정상적으로 추출되지 않는 문제가 있었는..

강승식 교수의 형태소분석기를 Python에서 활용하기

집단지성프로그래밍 책을 보다가 보니 꼭 필요한 것이 하나 없었다. 형태소분석기가 없으니 한글에 대해선 전혀 처리가 안된다. 그 이유때문에 형태소 분석기를 만들기엔 부담되고 그래서 강승식 교수의 형태소 분석기를 Python에 붙여보기로 했다. 그런데 의외로 간단하게 끝났다. 아래 코드를 컴파일 해서 사용하면 된다. 1. C 소스 파일 : PyKMA.c #include "Python.h" #include "ham-ndx.h" #include "ham-api.h" #include "keyword.h" static PyObject *ErrorObject; static PyObject* PyKMA_getstems(PyObject *self, PyObject *args) { PyObject* flist; int i..