Visual Studio CodeのC/C++拡張とgdbでのデバッグで、変数の中のUTF-8の文字列を文字化けさせずにうまく表示させる

WindowsのVisual Studio Codeにて、C/C++拡張とgdbでデバッグをしているときに、変数の中身のUTF-8の文字列が文字化け(数字の羅列)になって見られない、という問題がありました。それを解消するパッチ(スクリプト)を作りました。

その紹介、問題の検討過程、及び作業で学んだPythonの教訓について記します。

Continue reading

続々はじめてのPythonモジュール:AI的言語処理その5

はじめに

前回までで、形態素解析システムJUMANのPythonモジュールを作成してきました。

本稿では前回の教訓(lessons learned)の続きとして、pipで簡単にインストールできるようPYPIへのアップロードについてと、テストのモジュール化について書こうと思います。

Continue reading

続はじめてのPythonモジュール:AI的言語処理その4

形態素解析システムJUMANのPythonモジュールjumanyをPOSIX対応しました。

本稿では、POSIXではソースからライブラリをビルドし、またWindowsにはビルド済ライブラリを提供する場合の、setup.pyの書き方についてレポートします。

Continue reading

Windowsでお手軽Doc2Vecことはじめ:AI的言語処理その1

本稿では、人工知能的な言語処理を目的に、Word2Vec、Doc2Vecの機能を実装したgensimというPythonモジュールをMiniconda3環境にインストールします。そしてそこでDoc2Vecのチュートリアルを実行します。

チュートリアルを検討するだけで、結構なことが確認できます。

Continue reading