プログラマーのメモ書き

伊勢在住のプログラマーが気になることを気ままにメモったブログです

Python で text-to-speach を試してみる

先日の記事で、古いノートPCを復活させた話を書きましたが、早速使う時がきました。

伊勢市内の中学校を対象に、キャリア教育の一環として、市内の事業者などの有志が仕事の話をするビジネスパーク伊勢というのがあって、私も都合が合う時にたまに参加しています。

コロナが落ち着いたこともあり、先日、対面式で再開され、その際にプログラマーの仕事について話す機会がありました。 で、せっかくなのでデモがてら、こんなことできるよ、という紹介の一つとして、 python での text-to-speech を実演してきました。

その際に行ったセットアップなどについて、まとめておきます。

実行環境は次の通りです。

  • Lubuntu 18.04.6, 32bit 版
  • python 3.6.9
  • pip3 9.0.1

pyttsx3 のインストール

python で text-to-speech をするには pyttsx3 をつかうと簡単にできることを知りました(cs50.jp 見てたら出てきたので、さっそく使わせてもらいました)。このライブラリって、オフラインで動くんですよね、すげー。

まずは pip3 と pyttsx3 をインストールします。

mor@Lenovo3000:~$ sudp apt install python3-pip
mor@Lenovo3000:~$ pip3 install pyttsx3

使ってみます。

mor@Lenovo3000:~$ python3
Python 3.6.9 (default, Jan 26 2021, 15:33:00) 
[GCC 8.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import pyttsx3
>>> engine = pyttsx3.init()
Traceback (most recent call last):
  File "/home/mor/.local/lib/python3.6/site-packages/pyttsx3/__init__.py", line 20, in init
    eng = _activeEngines[driverName]
  File "/usr/lib/python3.6/weakref.py", line 137, in __getitem__
    o = self.data[key]()
KeyError: None

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/mor/.local/lib/python3.6/site-packages/pyttsx3/__init__.py", line 22, in init
    eng = Engine(driverName, debug)
  File "/home/mor/.local/lib/python3.6/site-packages/pyttsx3/engine.py", line 30, in __init__
    self.proxy = driver.DriverProxy(weakref.proxy(self), driverName, debug)
  File "/home/mor/.local/lib/python3.6/site-packages/pyttsx3/driver.py", line 50, in __init__
    self._module = importlib.import_module(name)
  File "/usr/lib/python3.6/importlib/__init__.py", line 126, in import_module
    return _bootstrap._gcd_import(name[level:], package, level)
  File "<frozen importlib._bootstrap>", line 994, in _gcd_import
  File "<frozen importlib._bootstrap>", line 971, in _find_and_load
  File "<frozen importlib._bootstrap>", line 955, in _find_and_load_unlocked
  File "<frozen importlib._bootstrap>", line 665, in _load_unlocked
  File "<frozen importlib._bootstrap_external>", line 678, in exec_module
  File "<frozen importlib._bootstrap>", line 219, in _call_with_frames_removed
  File "/home/mor/.local/lib/python3.6/site-packages/pyttsx3/drivers/espeak.py", line 9, in <module>
    from . import _espeak, toUtf8, fromUtf8
  File "/home/mor/.local/lib/python3.6/site-packages/pyttsx3/drivers/_espeak.py", line 18, in <module>
    dll = cdll.LoadLibrary('libespeak.so.1')
  File "/usr/lib/python3.6/ctypes/__init__.py", line 426, in LoadLibrary
    return self._dlltype(name)
  File "/usr/lib/python3.6/ctypes/__init__.py", line 348, in __init__
    self._handle = _dlopen(self._name, mode)
OSError: libespeak.so.1: cannot open shared object file: No such file or directory
>>> 

あれ?初期化しただけなのにエラーになりました。

ちょっとネットを調べてみると、 Linux の場合、 espeak というパッケージがないとだめなようです。

なので、必要なパッケージをインストールします。

mor@Lenovo3000:~$ sudo apt install espeak
mor@Lenovo3000:~$ sudo apt install ffmpeg

libespeak1 は espeak を入れると入るようです。

もう一度試すと

mor@Lenovo3000:~/work$ python3
Python 3.6.9 (default, Jan 26 2021, 15:33:00) 
[GCC 8.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import pyttsx3
>>> engine = pyttsx3.init()
>>> engine.say("hello world")
>>> engine.runAndWait()
>>> 

ちゃんと聞こえますね。これ、結構楽しいですね。

英語だけだとなんなので、日本語も試してみます。

>>> 
>>> engine.say("こんにちは")
>>> engine.runAndWait()
>>> 

あれ?日本語だと使えないですね。

日本語への対応

調べてみると、

python - Pyttsx3 does not read text in other languages - Stack Overflow

言語設定を調べて、切り替える必要があるようです。確認してみます。

こんな内容の test_tts.py を作ります。

import pyttsx3

engine = pyttsx3.init()
voices = engine.getProperty('voices')
for voice in voices:
    print(f"Voice: {voice.name}")

これを実行してみます。

mor@Lenovo3000:~/work$ python3 test_tts.py 
Voice: afrikaans
Voice: aragonese
Voice: bulgarian
Voice: bosnian
Voice: catalan
Voice: czech
Voice: welsh
Voice: danish
Voice: german
Voice: greek
Voice: default
Voice: english
Voice: en-scottish
Voice: english-north
Voice: english_rp
Voice: english_wmids
Voice: english-us
Voice: en-westindies
Voice: esperanto
Voice: spanish
Voice: spanish-latin-am
Voice: estonian
Voice: persian
Voice: persian-pinglish
Voice: finnish
Voice: french-Belgium
Voice: french
Voice: irish-gaeilge
Voice: greek-ancient
Voice: hindi
Voice: croatian
Voice: hungarian
Voice: armenian
Voice: armenian-west
Voice: indonesian
Voice: icelandic
Voice: italian
Voice: lojban
Voice: georgian
Voice: kannada
Voice: kurdish
Voice: latin
Voice: lingua_franca_nova
Voice: lithuanian
Voice: latvian
Voice: macedonian
Voice: malayalam
Voice: malay
Voice: nepali
Voice: dutch
Voice: norwegian
Voice: punjabi
Voice: polish
Voice: brazil
Voice: portugal
Voice: romanian
Voice: russian
Voice: slovak
Voice: albanian
Voice: serbian
Voice: swedish
Voice: swahili-test
Voice: tamil
Voice: turkish
Voice: vietnam
Voice: vietnam_hue
Voice: vietnam_sgn
Voice: Mandarin
Voice: cantonese
mor@Lenovo3000:~/work$ 

まじですか。確かに、日本語が入っていないです。

もう少し調べてみると、 espeak で対応していない言語も espeak-ng だとカバーされている場合があるとのことです。

なので、下記記事を参考に espeak-ng に切り替えてみます。

Is there a way to use the espeak-ng engine? · Issue #103 · nateshmbhat/pyttsx3 · GitHub

mor@Lenovo3000:~/work$ sudo apt purge espeak
mor@Lenovo3000:~/work$ sudo apt autoremove
mor@Lenovo3000:~/work$ sudo apt install espeak-ng
mor@Lenovo3000:~/work$ cd /usr/lib/i386-linux-gnu/
mor@Lenovo3000:/usr/lib/i386-linux-gnu$ sudo ln -s libespeak-ng.so.1 libespeak.so.1

espeak (および libespeak1 )をアンインストールして、espeak-ng を入れて、libespeak-ng.so.1 にシンボリックリンクを張ればよいようです。 そのうえで、しゃべる前に、前述の記事にあったように setProperty で言語を指定すればよいようです。

試してみます。

mor@Lenovo3000:~/work$ python3
Python 3.6.9 (default, Jan 26 2021, 15:33:00) 
[GCC 8.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import pyttsx3
>>> engine = pyttsx3.init()
>>> engine.setProperty("voice", "Japanese")
>>> engine.say("こんにちは")
>>> engine.runAndWait()

おお、日本語でしゃべれますね。

ただ、漢字は読めずに、ひらがなでないとダメとか、文がながいと途端に聞き取りにくくなるとか、微妙な点もあるけど、まずもって動くのはいいですね。

まとめ

冒頭の出前授業でも無事に text-to-speach を見せることができました。デモ的には、

import pyttsx3

engine = pyttsx3.init()

engine.setProperty("voice", "Japanese")

#rate = engine.getProperty("rate")
#print(f"rate: {rate}")
engine.setProperty("rate", 130)

while (1):
    txt = input("ひらがなで文字をにゅうりょくしてください: ")

    #print(f"text is: [{txt}]")
    if txt == None or len(txt) == 0:
        exit()
    engine.say(txt)
    engine.runAndWait()

上記のように、コマンドラインで入力した文言をそのまま音声で読む形にしました。機械的な合成音が面白いようで、ややうけ、という感じでした。

ちなみに、 Scratch でネコを動かしたほうがウケていたのは、内緒にしておいてください。恐るべし、 Scratch 。

古いノートPCの復活

家に1台、ノートPCが余ってまして、Lubuntu いれて外での簡単なデモとかに使ってました。が、コロナの影響で外出することもなかったためここ2年ぐらい放置状態でした。

さすがに古いし、重いし、もう廃棄処分にしようかなと思っていた矢先、コロナも(少し)落ち着いてきて、また外でデモ的に使う機会が出てきたので、もうちょっと頑張って使うことにしました。

せっかくの機会なので、ついでに SSD に乗せ換えて、ちょっとでも使い勝手を良くしたいと思います。古いものなので参考にならないと思いますが、自分の記録用にセットアップまわりをメモ書きしておきます。

対象機種

Lenovo 3000 v100 という 12.1 インチの B5 ノートになります。

ネットで、仕様を調べたら、下記が見つかりました。

New Lenovo 3000 V100 12.1-in widescreen notebooks with Intel Core Duo processor T2300E -- Sleek

2006 年発売モデルなので、もう15年も前の機種になりますね。よく壊れずに動いているもんだと感心してしまいました。

もっとも、昔(調べたら 2016 年でした)、RTC 用のバッテリーとモバイルバッテリーは使い物にならなくて交換したような覚えがあります(当時の交換のあれこれはブログに書かなかったようですね、しまったなー)。

HDD を SSD に換装

HDD を SSD 化しておきます。

改めて、 HDD のインターフェースを調べたのですが、上記の仕様のページではよくわかりませんでした。

あれこれネットを探していると、価格.com の口コミに、この機種へのレビュー記事へのリンクがあり、そこに SATA とありました。

あとから、気づいたのですが、 BIOS で確認したほうが確実でしたね。

f:id:junichim:20211203223245p:plain

HDD のところに、 STAT1 の表記が見られます。

ということで、 SATA 2.5インチであれば大丈夫そうなので、 SSD は Amazon でぽちっと買いました。購入したSSDはこちらになります。

HDD のとりはずし

マニュアルはこちらです。

バッテーリーを外して、ネジを緩めて、HDDのふたをはずせば、OKと思いきや、なかなかふたが外れません。

f:id:junichim:20211210152247p:plain

少し横から内側に押すようにすると引っかかりが外れて、うまく取れました。

f:id:junichim:20211210152415p:plain

こんな感じで両サイドとネジと反対側にひかっかりがあったためのようです。

無事にふたが取れると、HDDがお目見えします。

マニュアルによると、引っ張るベロのようなものを使って、取り出すとあるのですが、どうも見当たりません。よく見ると、HDDの下側に何か回り込んでいるようなので、細い棒でひっかけて取り出してみます。

f:id:junichim:20211210152553p:plain

全部出すとベロのような持ち手が現れます。

f:id:junichim:20211210153233p:plain

これを横方向に引っ張り、端子からHDDを外して、次に上側に持ち上げると、取り出すことができます。

f:id:junichim:20211210153310p:plain

東芝製、40GB、5400rpm のHDD(MK4032GSX)ですね。

HDDをカバーから取り外して、SSDに付け替えます。ネジが馬鹿みたいに固くて、ちょっと取り外しに苦労しました。

f:id:junichim:20211210153925p:plain

取り外しと逆の手順で、SSDを取り付ければOKです。取付時は、ネジ位置の部分が少し出っ張るので、本体側にある切れ込みに合わせないとうまく入りませんでした(取り外し時に上側に持ち上げたときの状態に合わせて、入れなおせばうまく合うはずです)。

うまく本体に収まったら、端子側に押し込めば完了です。

フタを取り付けて、 BIOS を起動して、正しく認識しているか確認します。

f:id:junichim:20211210154340p:plain

120GB と今回購入した SSD の容量になっているので、大丈夫そうですね。

あとはPCを再起動して、 Lubuntu をインストールします。

ちなみに、BIOSから抜けた直後は、なぜかうまく起動しませんでした。一度電源を切って、再度電源を入れたら問題なかったです。

Lubuntu 18.04 のインストール

いままでの Lubuntu が 14.04 だったので、32bit版で一番新しい 18.04 を入れなおすことにしました。

まず最初に、こちらから 32bit 版の iso イメージをダウンロードしてきます。

次に、Rufus の portable 版を使って、インストールメディアを USB 上に作成します。

続いて、BIOS の起動ドライブを USB を優先に変更します。USB HDD をHDDより上位にすればOKです。

f:id:junichim:20211203223844p:plain

(画面は SSD 換装前のものです)

一番上が USB FDD となっているのは時代ですね。ここで、いったん、電源を切ります。

次に、さきほど作った USB を刺して、起動します。すると、 USB から Lubuntu が起動してインストールが選択できる状態になります。あとは、画面指示に従えばOKです。なお、インストール時は、最小構成を選択しておきました。

これで、復活ですね。

Lubuntu のセットアップ

たまのデモにしか使わないのですが、いくつかセットアップしておきます。

Chromium のインストール

apt でインストールすればOKです。

mor@mor-LENOVO3000-V100:~$ sudo apt install chromium-browser

これでインストールできましたが、デフォルトブラウザは Firefox のままなので、こちらの記事などを参考にして、Chromium に切り替えておきます。

mor@mor-LENOVO3000-V100:/etc/alternatives$ update-alternatives --list x-www-browser
/usr/bin/chromium-browser
/usr/bin/firefox
mor@mor-LENOVO3000-V100:/etc/alternatives$ 
mor@mor-LENOVO3000-V100:/etc/alternatives$ sudo update-alternatives --config x-www-browser
alternative x-www-browser (/usr/bin/x-www-browser を提供) には 2 個の選択肢があります。

  選択肢    パス                     優先度  状態
------------------------------------------------------------
* 0            /usr/bin/firefox            40        自動モード
  1            /usr/bin/chromium-browser   40        手動モード
  2            /usr/bin/firefox            40        手動モード

現在の選択 [*] を保持するには <Enter>、さもなければ選択肢の番号のキーを押してください: 1
update-alternatives: /usr/bin/x-www-browser (x-www-browser) を提供するためにマニュアルモードで /usr/bin/chromium-browser を使います
mor@mor-LENOVO3000-V100:/etc/alternatives$ 

おわりに

一応これで、使えるようになったので、もう少し頑張ってもらうことにしました。さて、あと何回ぐらい活躍するかな?

PC を3画面化

今の PC の CPU である第11世代の Intel Core i9 は3系統のビデオ出力が可能だそうですが、BTO でお願いした Sycom で選べるマザーボードで対応しているものがありませんでした。

なので、今は、オンボード出力の HDMI と DisplayPort を使って、2画面で作業をしています。

これで、問題ないと思っていたのですが、 DisplayPort 側のディスプレイの電源を切ると、そちらの画面で開いていたウィンドウなどがもう一方のディスプレイに寄せられてしまいます。はっきり言って、非常に使いにくいです。

ググってみると、割と有名な問題だったようです。

上記の記事でもいろいろと対応方法が書かれていますが、これだ!というものがありません。

致し方ないので、しばらくは、だましだましで使っていたのですが、やっぱりどうも使いにくいです。

で、そうこうしているうちに、机を新調することになったので、この機にあこがれの3画面化にして、ついでに DisplayPort を使わないようにしてみました。その際のメモをまとめておきます。

机を新調

仕事部屋が狭いうえに、2階にある(しかも階段が狭い)ので、オンラインでの注文はちょっと踏み切れませんでした(もちろん、見積もり時に2階への搬送や組み立てに対応しますと明示しているところもありましたので、一度相談するのもありかもしれません)。

ましてや、自分で机を運んだり組み立てたりは無理だと思ったので、困ったときは身近な知り合いということで、 アクトさんにお願いして、仕事部屋に搬入後、組み立てていただくことにしました。

いやー、仕事早いですね。1時間ぐらいで狭い部屋なのに、見事に机をくみ上げていただきました。ありがとうございました。

机は、幅160cm 奥行 70cm のものを選びました。今どきの机っぽくて、配線がうまく隠せるようになっているのがいいですね。

3画面化

さて、机が大きくなり、ディスプレイを3台置けるようになったので、3画面化を進めます。

希望としては、

  • HDMI もしくは DVI-D で3画面にする(もし、すべて HDMI で統一できればなおよし)
  • 3画面表示時、 WUXGA 1920 x 1200 が表示可能

というところです。

どうやって3画面化するかな?を考えて、いろいろと検討してみました。

案1:3画面以上の出力を持つグラボを購入

いろいろ調べてみると HDMI で4画面出力をもつようなグラボがいくつかありました。

「HDMI出力端子数:3個~」のビデオカードの商品の一覧

お値段も1万円台として、非常にリーズナブルです。

ただ、仕様とかを見てみても、3画面以上の出力で 1920x1200 が出るかどうかがつかめませんでした。

最悪、買ってみて試すのもありなのですが、失敗すると使わないグラボが1枚できてしまうので、さすがに躊躇します。

1万円台の次だと4万円台と価格が大きく上がるので、この案はあきらめました。

案2:オンボードグラフィックス+追加グラボ

どうしたものか考えてたとき、ふと、オンボードと追加グラボの両方を使って、3画面出せばいいんじゃないか?と気づきました。

早速、調べてみます。 ASUS の FAQ によるとできそうですね。

オンボードのモニター出力を有効にする方法 | サポート 公式 | ASUS 日本

パフォーマンスが悪くなる、と気になることが書いてありますが、主な用途はコーディングと事務仕事なので、多分大丈夫でしょう。

念のため、同じ設定項目が今のマザーボード(ASUS ROG STRIX Z590-F GAMING WIFI)にあるか見ると、似たような項目、『統合グラフィックスを常に有効』、というのがあります。これでいけそうですね。

グラボ購入

グラボ自体にそんなにこだわりはないので、値段と端子の種類などを中心に検討した結果、玄人志向の GT 1030 のものにしました。

取付

さっそく取り付けてみます。の前に、一度 PC を再起動して、 UEFI を呼び出して、設定項目を変更します。

詳細->システムエージェント設定->統合グラフィック設定 とすすみ、『統合グラフィックを常に有効』が Disable だったのをEnableに変更します。

f:id:junichim:20211210150308j:plain

設定を保存して、電源を切っておきます。

次に、取付です。

今のマザーボードの場合、PCI Express が M.2 と帯域を共有していたりして、どこにつけるか迷いましたが、マニュアルを見るとグラボ1枚指すときは PCIEX_1 につけろ、とあったので、その通りにします。

取り付け後、オンボード(HDMI)とグラボ(HDMI)にそれぞれディスプレイにつないで、電源を入れます。

最初は、1画面分(オンボード側)にしか出力がなかったのですが、しばらくするとドライバーが勝手にインストールされたようで、グラボ側につないだディスプレイにも映像が出るようになりました。玄人志向の製品ページには自分でドライバをいれろみたいなことが書いてありましたが、自動でやってくれました。

Windows 起動後、デバイスマネージャーを見ても、ちゃんと2つのグラフィックボードが認識されていました。

f:id:junichim:20211210150652p:plain

これで、オンボード側とグラボ側の両方から同時に出力することが確認できたので、設定に問題はないと思います。

3画面表示

最後は、グラボ側の2出力にディスプレイを付けて、あこがれの3画面で表示させてみます。

f:id:junichim:20211210150957p:plain

ちゃんと映りました。

いやー、なかなか壮観ですね。

とはいえ、実際の使い勝手については、まだまだ分からないので、そのあたりはいろいろと試していきたいと思います。