目次
pg_repack
ビルドできても例外エラー
2021年の質問:Windowsでpg_repackをビルドしても例外エラーになってしまう。
pg_repack binaries under windows
下記サイトは2018年のもので静的なpostgres.libを作成して動作したとの報告があったが、現在は postgres.lib が提供されており、上記サイトでも postgres.lib をリンクしても、例外エラーで動作しないことから問題は別物と考える。
この問題を解決して、Windowsでもpg_repackを使えるようにしたい。
調査
pg_repack のデバッグでは、set_pglocale_pgservice(argv[0], “pgscripts”); を実行すると例外エラーとなる。
vaccumedb のデバッグでは、set_pglocale_pgservice(argv[0], “pgscripts”); を使用していても正常に動作する。違いとしてvaccumedb では、postgres.lib をリンクしていない。
pg_repack以外で exe形式で postgres.lib をリンクしたものは他にない。
関数 | モジュール | ソース元 |
---|---|---|
set_pglocale_pgservice | libpgcommon.lib | |
setlocale(pgwin32_setlocale) | libpgport.lib | |
select(pgwin32_select) | postgres.lib | backend¥port¥win32¥socket.c |
pgwin32_dispatch_queued_signals | postgres.lib | backend¥port¥win32¥signal.c |
errstart | postgres.lib | backend\utils\error\elog.c |
pg_repack を pgwin32_selectで検索しても見つからないが、select で検索すると見つかる。
ret = select(max_fd + 1, &input_mask, NULL, NULL, &timeout);
- win32.port.h
#define setlocale(a,b) pgwin32_setlocale(a,b) #define select(n, r, w, e, timeout) pgwin32_select(n, r, w, e, timeout)
pg_hello を作成して postgres.lib をリンクしないで pg_repack.c のソースコードに徐々に近づけた。
そして、rebuild_indexes で pgwin32_select が参照している旨のLINKエラーのみになった。
そこで、pg_repack.c を、pg_hello.c に名前を変更してビルド、同様に rebuild_indexes で、pgwin32_select が参照している旨のLINKエラーのみになった。
下記のコードをコメントアウトすると、LINKエラーは出なくなる。
ret = select(max_fd + 1, &input_mask, NULL, NULL, &timeout);
必要なobjファイルだけをリンク
socket.obj、singal.obj をリンクすると、7つの未解決エラーが出る。
1>socket.obj : error LNK2019: 未解決の外部シンボル errstart が関数 pgwin32_select で参照されました 1>signal.obj : error LNK2001: 外部シンボル errstart は未解決です 1>socket.obj : error LNK2019: 未解決の外部シンボル errfinish が関数 pgwin32_select で参照されました 1>signal.obj : error LNK2001: 外部シンボル errfinish は未解決です 1>socket.obj : error LNK2019: 未解決の外部シンボル errmsg_internal が関数 pgwin32_select で参照されました 1>signal.obj : error LNK2001: 外部シンボル errmsg_internal は未解決です 1>signal.obj : error LNK2019: 未解決の外部シンボル write_stderr が関数 pg_signal_thread で参照されました
このぐらいならと elog.obj を追加すると多くの未解決エラーが出る。同じように追加するとどんどん別のobjファイルから未解決エラーが出る。postgres.libとリンクするのと変わらなくなるため、この方法での解決はやめた。
関数名 | モジュール名 | オブジェクト名 |
---|---|---|
ExceptionalCondition | asset.c | assert.obj |
pg_codepage_to_encoding | chklocale.c | chklocale.obj |
MemoryContextStrdup | mcxt.c | mcxt.obj |
GetTopTransactionIdIfAny | xact.c | xact.obj |
GetMessageEncoding | mbutils.c | mbutils.obj |
pgwin32_message_to_UTF16 | mbutils.c | mbutils.obj |
pq_putmessage_v2 | pqcomm.c | pqcomm.obj |
pq_beginmessage | pdformat.c | pdformat.obj |
pq_endmessage | pqformat.c | pqformat.obj |
pq_sendstring | pqformat.c | pqformat.obj |
pq_send_ascii_string | pdformat.c | pdformat.obj |
pg_localtime | localtime.c | localtime.obj |
pg_strftime | strftime.c | strftime.obj |
ProcessInterrupts | postgres,c | postgres,obj |
GetBackendTypeDesc | miscinit.c | miscinit.obj |
pgstat_get_my_query_id | backend_status.c | backend_status.obj |
write_syslogger_file | syslogger.c | syslogger.obj |
proc_exit | ipc.c | ipc.obj |
MemoryContextReset | mcxt.c | mcxt.obj |
get_ps_display | ps_status.c | ps_status.obj |
必要な関数だけを作成
socket.c と signal.c の必要関数を抜き出し、新しい socket.c を作成して、pg_repack に socket.c を追加
次項目の winSock2.h にある Select関数を使用して問題ないなら、新しい socket.c は使用しない方針とする。
select関数の参照先の違い
pg_repack の select関数 は、win32_port.h → socket.c の pgwin32_select関数を参照している。
pgbench や pg_recvlogical の select関数 は、winSock2.h の select関数を参照している。
select関数 を win32_port.h か winSock2.h を参照させる違いはどこにあるのか?
put.h にある #include “c.h” を消すと select関数の定義の参照されなくなるし bool型なども定義がなくなる。
pgbench.c には、bool型とselect関数があるが、参照エラーになっていない。
put.h にある、#include “postgres_fe.h” に切り替えたら、select関数の定義がwinSock2.h の select関数を参照するようになった。
versionの指定
「pg_repack –version」を実行したら、unknown となった。
Makefileでは、コンパイル時にREPACK_VERSIONにバージョン番号をセットしているが、Windowsでは REPACK_VERSION を指定していないため、プロジェクトのプロパティ C/C++のプリプロセッサに REPACK_VERSION=1.4.7 を追加する。
lib側も同様に設定すること
- pg_repack.c
#ifdef REPACK_VERSION /* macro trick to stringify a macro expansion */ #define xstr(s) str(s) #define str(s) #s const char *PROGRAM_VERSION = xstr(REPACK_VERSION); #else const char *PROGRAM_VERSION = "unknown"; #endif
EnterCriticalSectionで例外エラー
0x00007FFB838949E6 (ntdll.dll) で例外がスローされました (pg_repack.exe 内): 0xC0000005: 場所 0x0000000000000024 への書き込み中にアクセス違反が発生しました
C++についてです。EnterCriticalSection()関数等を用いて排他制御を行おうとしていますが、EnterCriticalSectionで以下の例外が発生します。
InitializeCriticalSection() しましたか?
調査すると、InitializeCriticalSection()を参照している init_cancel_handler関数が、コメントアウトされており呼ばれていない。
on_before_exec関数と on_after_exec関数の2ヶ所をinit_cancel_handler関数を追記して修正すると例外エラーが発生しなくなった。
#ifdef WIN32 init_cancel_handler(); EnterCriticalSection(&cancelConnLock); #endif
relhasoids列がないエラー
SELECT * FROM repack.tables SQL: COLUMN "relhasoids" does NOT exist
relhasoidsは、PostgreSQLのシステムカタログに存在するカラムであり、バージョン11までは存在していたが、バージョン12からは削除されている。
pg_repack.sql.in ファイルには、get_storage_param 関数内で relhasoids を使用している。
- pg_repack.sql.in
get_storage_param -- table oid SELECT 'oids = ' || CASE WHEN relhasoids THEN 'true' ELSE 'false' END FROM pg_class
Makefileファイル内にて PostgreSQL12以降は relhasoids を false に書き換えている。
- Makefile
# It is not possible to create tables with OIDs on PostgreSQL 12 or later ifeq ($(shell echo $$(($(INTVERSION) < 1200))),1) RELHASOIDS := relhasoids else RELHASOIDS := false endif pg_repack--$(REPACK_VERSION).sql: pg_repack.sql.in sed 's,REPACK_VERSION,$(REPACK_VERSION),g' $< \ | sed 's,relhasoids,$(RELHASOIDS),g'> $@;
PostgreSQL 12以降は最終的には下記に書き換わる。
※Windowsでは、Makefile を使用しないので、手動で書き換える。
- pg_repack.sql
get_storage_param -- table oid SELECT 'oids = ' || CASE WHEN FALSE THEN 'true' ELSE 'false' END FROM pg_class
簡易テスト
ようやく動作させることが出来るようになったので、簡易テスト
- テストデータ作成
CREATE TABLE t1 (id INT PRIMARY KEY, val text); SELECT pg_size_pretty(pg_total_relation_size('t1')); INSERT INTO t1 VALUES(generate_series(1,10000),'AAA'); SELECT pg_size_pretty(pg_total_relation_size('t1')); -- 5回ほど実行 UPDATE t1 SET VAL = 'BBB'; UPDATE t1 SET VAL = 'BBB'; UPDATE t1 SET VAL = 'BBB'; UPDATE t1 SET VAL = 'BBB'; UPDATE t1 SET VAL = 'BBB'; SELECT pg_size_pretty(pg_total_relation_size('t1')); -- 2736 kB -- バキュームしてもサイズは小さくならないことを確認 VACUUM t1; SELECT pg_size_pretty(pg_total_relation_size('t1')); -- 2736 kB
DB:wh_test、ユーザー:wh_test、スキーマ:wh_test にある t1 テーブル で pg_repack を実行する。
また、-e オプション(–echo)で、サーバに送信するSQLを表示するようにしておきます。
pg_repack -n -t wh_test.t1 -d wh_test -U wh_test -e LOG: (query) SET search_path TO pg_catalog, pg_temp, public LOG: (query) SET search_path TO pg_catalog, pg_temp, public LOG: (query) select repack.version(), repack.version_sql() LOG: (query) SET statement_timeout = 0 LOG: (query) SET search_path = pg_catalog, pg_temp, public LOG: (query) SET client_min_messages = warning LOG: (query) SELECT r FROM (VALUES ($1)) AS given_t(r) WHERE NOT EXISTS( SELECT FROM repack.tables WHERE relid=to_regclass(given_t.r) ) LOG: (param:0) = wh_test.t1 LOG: (query) SELECT t.*, coalesce(v.tablespace, t.tablespace_orig) as tablespace_dest FROM repack.tables t, (VALUES (quote_ident($1::text))) as v (tablespace) WHERE (relid = $2::regclass) ORDER BY t.relname, t.schemaname LOG: (param:0) = (null) LOG: (param:1) = wh_test.t1 INFO: repacking table "wh_test.t1" LOG: (query) SELECT pg_try_advisory_lock($1, CAST(-2147483648 + $2::bigint AS integer)) LOG: (param:0) = 16185446 LOG: (param:1) = 16738 LOG: (query) BEGIN ISOLATION LEVEL READ COMMITTED LOG: (query) SET LOCAL statement_timeout = 100 LOG: (query) LOCK TABLE wh_test.t1 IN ACCESS EXCLUSIVE MODE LOG: (query) RESET statement_timeout LOG: (query) SELECT pg_get_indexdef(indexrelid) FROM pg_index WHERE indrelid = $1 AND NOT indisvalid LOG: (param:0) = 16738 LOG: (query) SELECT indexrelid, repack.repack_indexdef(indexrelid, indrelid, $2, FALSE) FROM pg_index WHERE indrelid = $1 AND indisvalid LOG: (param:0) = 16738 LOG: (param:1) = (null) LOG: (query) SELECT repack.conflicted_triggers($1) LOG: (param:0) = 16738 LOG: (query) CREATE TYPE repack.pk_16738 AS (id integer) LOG: (query) CREATE TABLE repack.log_16738 (id bigserial PRIMARY KEY, pk repack.pk_16738, row wh_test.t1) LOG: (query) CREATE TRIGGER repack_trigger AFTER INSERT OR DELETE OR UPDATE ON wh_test.t1 FOR EACH ROW EXECUTE PROCEDURE repack.repack_trigger('INSERT INTO repack.log_16738(pk, row) VALUES( CASE WHEN $1 IS NULL THEN NULL ELSE (ROW($1.id)::repack.pk_16738) END, $2)') LOG: (query) ALTER TABLE wh_test.t1 ENABLE ALWAYS TRIGGER repack_trigger LOG: (query) SELECT repack.disable_autovacuum('repack.log_16738') LOG: (query) BEGIN ISOLATION LEVEL READ COMMITTED LOG: (query) SELECT pg_backend_pid() LOG: (query) SELECT pid FROM pg_locks WHERE locktype = 'relation' AND granted = false AND relation = 16738 AND mode = 'AccessExclusiveLock' AND pid <> pg_backend_pid() LOG: (query) COMMIT LOG: (query) BEGIN ISOLATION LEVEL SERIALIZABLE LOG: (query) SELECT set_config('work_mem', current_setting('maintenance_work_mem'), true) LOG: (query) SET LOCAL synchronize_seqscans = off LOG: (query) SELECT coalesce(array_agg(l.virtualtransaction), '{}') FROM pg_locks AS l LEFT JOIN pg_stat_activity AS a ON l.pid = a.pid LEFT JOIN pg_database AS d ON a.datid = d.oid WHERE l.locktype = 'virtualxid' AND l.pid NOT IN (pg_backend_pid(), $1) AND (l.virtualxid, l.virtualtransaction) <> ('1/1', '-1/0') AND (a.application_name IS NULL OR a.application_name <> $2) AND a.query !~* E'^\\s*vacuum\\s+' AND a.query !~ E'^autovacuum: ' AND ((d.datname IS NULL OR d.datname = current_database()) OR l.database = 0) LOG: (param:0) = 6804 LOG: (param:1) = pg_repack LOG: (query) DELETE FROM repack.log_16738 LOG: (query) SELECT pid FROM pg_locks WHERE locktype = 'relation' AND granted = false AND relation = 16738 AND mode = 'AccessExclusiveLock' AND pid <> pg_backend_pid() LOG: (query) SET LOCAL statement_timeout = 100 LOG: (query) LOCK TABLE wh_test.t1 IN ACCESS SHARE MODE LOG: (query) RESET statement_timeout LOG: (query) CREATE TABLE repack.table_16738 WITH (oids = false) TABLESPACE pg_default AS SELECT id,val FROM ONLY wh_test.t1 WITH NO DATA LOG: (query) INSERT INTO repack.table_16738 SELECT id,val FROM ONLY wh_test.t1 LOG: (query) SELECT repack.disable_autovacuum('repack.table_16738') LOG: (query) COMMIT LOG: (query) CREATE UNIQUE INDEX index_16743 ON repack.table_16738 USING btree (id) LOG: (query) SELECT repack.repack_apply($1, $2, $3, $4, $5, $6) LOG: (param:0) = SELECT * FROM repack.log_16738 ORDER BY id LIMIT $1 LOG: (param:1) = INSERT INTO repack.table_16738 VALUES ($1.*) LOG: (param:2) = DELETE FROM repack.table_16738 WHERE (id) = ($1.id) LOG: (param:3) = UPDATE repack.table_16738 SET (id, val) = ($2.id, $2.val) WHERE (id) = ($1.id) LOG: (param:4) = DELETE FROM repack.log_16738 WHERE id IN ( LOG: (param:5) = 1000 LOG: (query) SELECT pid FROM pg_locks WHERE locktype = 'virtualxid' AND pid <> pg_backend_pid() AND virtualtransaction = ANY($1) LOG: (param:0) = {} LOG: (query) SAVEPOINT repack_sp1 LOG: (query) SET LOCAL statement_timeout = 100 LOG: (query) LOCK TABLE wh_test.t1 IN ACCESS EXCLUSIVE MODE LOG: (query) RESET statement_timeout LOG: (query) SELECT repack.repack_apply($1, $2, $3, $4, $5, $6) LOG: (param:0) = SELECT * FROM repack.log_16738 ORDER BY id LIMIT $1 LOG: (param:1) = INSERT INTO repack.table_16738 VALUES ($1.*) LOG: (param:2) = DELETE FROM repack.table_16738 WHERE (id) = ($1.id) LOG: (param:3) = UPDATE repack.table_16738 SET (id, val) = ($2.id, $2.val) WHERE (id) = ($1.id) LOG: (param:4) = DELETE FROM repack.log_16738 WHERE id IN ( LOG: (param:5) = 0 LOG: (query) SELECT repack.repack_swap($1) LOG: (param:0) = 16738 LOG: (query) COMMIT LOG: (query) BEGIN ISOLATION LEVEL READ COMMITTED LOG: (query) SAVEPOINT repack_sp1 LOG: (query) SET LOCAL statement_timeout = 100 LOG: (query) LOCK TABLE wh_test.t1 IN ACCESS EXCLUSIVE MODE LOG: (query) RESET statement_timeout LOG: (query) SELECT repack.repack_drop($1, $2) LOG: (param:0) = 16738 LOG: (param:1) = 4 LOG: (query) COMMIT LOG: (query) BEGIN ISOLATION LEVEL READ COMMITTED LOG: (query) ANALYZE wh_test.t1 LOG: (query) COMMIT LOG: (query) SELECT pg_advisory_unlock($1, CAST(-2147483648 + $2::bigint AS integer)) LOG: (param:0) = 16185446 LOG: (param:1) = 16738
2736 kB から 632 kBまでサイズが小さくなった。
- 結果
SELECT pg_size_pretty(pg_total_relation_size('t1')); -- 632 kB