Perl日記

PerlとかRubyとかPHPとかPythonとか

Go言語でVOICEROID2を操作してみたかった(Windows7)

Go言語を初めてWindowsで使ったよ、初めてWindowsAPIを使ったよメモ。(Windows7です)

VOICEROID2(結月ゆかり)を買ったので、なんとかして色々連携させてみたかった。

VOICEROID2 結月ゆかり

VOICEROID2 結月ゆかり

画面スクショ

f:id:rightgo09:20180213091440p:plain

うまくいった方法

喋らせたい文字をクリップボードに入れておいて、Ctrl+Vで貼り付けて、F5キーショートカットで再生して喋らせるやり方。
なんとかできたけど、いろいろ制約ができてしまった。

逆にうまくいなかった方法

SendMessage()やPostMessage()で文字を送ったり制御コードを送るやり方。
たぶんこちらの方が正攻法だと思うのだけど…。
なんでうまくいかなかったかはちょっとよくわからなかったです…。

VOICEROID2にCtrl+Vするコード

package main

import (
	"fmt"
	"syscall"

	"github.com/AllenDang/w32"
)

const voiceroid2WindowTitle = "VOICEROID2"

var mainHwnd w32.HWND

func init() {
	// ウィンドウタイトルからVOICEROID2のウィンドウハンドルを取得する
	mainHwnd = findWindow(voiceroid2WindowTitle)
	if mainHwnd == 0 {
		mainHwnd = findWindow(voiceroid2WindowTitle + "*")
		if mainHwnd == 0 {
			panic("cannot find window of VOICEROID2")
		}
	}
}

func findWindow(wName string) w32.HWND {
	return w32.FindWindowW(nil, syscall.StringToUTF16Ptr(wName))
}

func SayYukari() {
	w32.SetForegroundWindow(mainHwnd)

	ctlDown, ctlUp := inputKeys(w32.VK_CONTROL, 0x001D)
	bsDown, bsUp := inputKeys(w32.VK_BACK, 0x000E)
	aDown, aUp := inputKeys(0x0041, 0x001E)
	vDown, vUp := inputKeys(0x0056, 0x002F)
	f5Down, f5Up := inputKeys(w32.VK_F5, 0x003F)
	ipts := []w32.INPUT{
		// Ctrl + A
		ctlDown, aDown, aUp, ctlUp,
		// BackSpace
		bsDown, bsUp,
		// Ctrl + V
		ctlDown, vDown, vUp, ctlUp,
		// F5
		f5Down, f5Up,
	}
	ret := w32.SendInput(ipts)
	fmt.Println("w32.SendInput result:", ret)
}

func inputKeys(vk, scan uint16) (w32.INPUT, w32.INPUT) {
	down := w32.INPUT{
		Type: w32.INPUT_KEYBOARD,
		Ki: w32.KEYBDINPUT{
			WVk:   vk,
			WScan: scan,
		},
	}
	up := w32.INPUT{
		Type: w32.INPUT_KEYBOARD,
		Ki: w32.KEYBDINPUT{
			WVk:     vk,
			WScan:   scan,
			DwFlags: 0x0002,
		},
	}
	return down, up
}

だめだったパターン…

// Aを送る
w32.SendMessage(mainHwnd, w32.WM_KEYDOWN, 0x0041, 1)
w32.SendMessage(mainHwnd, w32.WM_KEYUP, 0x0041, 0x6000001)

やってみたメモ

WindowsAPIを使ったといっても、 AllenDang/w32 を使わせてもらっただけである。
幸いこの中にあるものだけでうまくできた。

KEYBDINPUT構造体を押したいキーの分だけ作って、SendInput()で送る。

バーチャルキーコード(wvk)は、msdnのページを見たり、よくあるやつ(Aは41とか)ですぐわかったけど、スキャンコード(wscan)はよくわからなかったので、spy++で実際に送られてる中身を覗き見てそれをそのまま使った。



SendInput()はSendMessage()などと違って、ウィンドウハンドルを指定できない。
つまりその時点でアクティブになっているウィンドウに対してキーが送られる。
なので、邪道な感じだけど、喋らせるときにVOICEROID2ウィンドウをSetForegroundWindow()でアクティブにしている。
更に邪道な感じで、Ctrl+Vがうまく動くためには、テキスト入力枠にフォーカスが当たってCtrl+Vが押せる状態でなければならない。
(これどうしたらいいんだろうか?)


VOICEROID2は中身が一個のウィンドウっぽくて、メモ帳で試したときとは違い、入れ子のウィンドウになっていなかった。メモ帳は"Edit"というクラス名の子ウィンドウにキーをSendMessage()すれば動いた。VOICEROID2には唯一の親ウィンドウに送ればいいということかと思ったが、そういう感じでもないっぽい? よくわからなかった。