EDPC Y

https://atcoder.jp/contests/dp/tasks/dp_y

座標をpairに格納してソートしたものをPとする。訪れるマスのPのindexをa_1 < a_2 < a_3 <...< a_mとすると、a_1->a_2->a_3->...->a_mの順番でしか訪問できない。なので、最後に訪れる場所で場合分けできて包除できる。
包除の問題で集合ではなく個数でまとめて持てる場合は、向きをつけられるという特性があるからだと思いました。

int H, W, N;
pi P[MAX_N];
ll dp[MAX_N];

void solve() {
	cin >> H >> W >> N;
	H--; W--;
	rep(i, 0, N) {
		int a, b;
		cin >> a >> b; a--; b--;
		P[i] = pi(a, b);
	}
	sort(P, P + N + 1);
	C_init(H + W);

	rer(i, N + 1, 0) {
		int a = P[i].fst, b = P[i].sec;
		dp[i] = C(H - a + W - b, W - b);
		rep(j, i + 1, N + 1) {
			int c = P[j].fst, d = P[j].sec;
			ADD(dp[i], mod - dp[j] * C(c - a + d - b, d - b) % mod);
		}
		// debug(dp[i], a, b);
	}
	cout << dp[0] << "\n";
}

EDPC埋め完了。でもYが一番むずかしいと思う。

SRM700Med

https://community.topcoder.com/stat?c=problem_statement&pm=14266

完全に知っているかどうかの問題ですが…

問題文がややこしいが、{1,2,...,n}から{1,2,...,n}への関数fを無限回適用したものをgとして、g(1),g(2),...,g(n)がk個の値を取る時のfの個数を求めよという問題になる。グラフに言い換えるとn頂点n辺のグラフになり、連結成分をみると、dfs+単純ループとなっている。なので単純ループに含まれる頂点数がkになるものを数え上げれば良い。
k頂点で単純ループを作る方法をdp[k]とすると、答えはdp[k]*C(n,k)*T(n,k)となる。ここでCはコンビネーション、T(n,k)=k*n^(n-k-1)。
C(n,k)はn頂点のうちどれを単純ループに含めるか、T(n,k)はn頂点k連結成分の森の数である。詳しくは
https://en.wikipedia.org/wiki/Cayley%27s_formula
を参照。
dp[i]の遷移はdp[i+j]にdp[i]*C(k-i-1,j-1)*(j-1)!を足し合わせれば良い。係数は取られていない頂点のうち番号最小のものでj頂点のループを作る方法の数である。よってO(K^2)で解けた。

ll dp[5010];

struct CrazyFunctions {
	int n;
	int k;
	int count(int _n, int _k) {
		n = _n, k = _k;
		C_init(n);
		memset(dp, 0, sizeof(dp));
		dp[0] = 1;
		rep(i, 0, k) {
			rep(j, 1, k + 1) {
				if(i + j > k) continue;
				ADD(dp[i + j], dp[i] * C(k - i - 1, j - 1) % mod * fac[j - 1] % mod);
			}
		}
		ll res = dp[k];
		if(n != k) {
			MUL(res, C(n, k) * k % mod * mod_pow(n, n - k - 1) % mod);
		}
		return res;
	}
};

なんかO(N+K)で解いている人がいますが…よくわかりません…これが現実的な解法だと思います。

AGC029

https://atcoder.jp/contests/agc029/tasks

冷えました…

A
結局はWを動かす操作です。
B
面白い。1,2,3,....2^30のグラフを考えると、明らかに木です。問題のグラフは明らかにこのグラフの部分グラフなので森です。
あとはgreedyに取っていけばいいです。ただし2^nは注意。
C
重めのO(NlogNlogmaxA)書いたら落ちてかなしい。ちゃんとO(NlogmaxA)にしてAC。てか最初からstackで良いことにきづけないの良くない。
D
めっちゃ解かれてて焦ったけど誤読してた。高橋くんは常に動かさないといけなくて、青木くんはブロック上に来たら横移動をやめます。
E
1を根とした木の上に行きたい気分なので、後はsimulationすれば解けるかなあとは思いました。
F
全然つっかえなかったので成長だと思う。うまく問題を分析して妥当な予想を立てながら解けてキモチイ。

頂点vを取る操作はだいたい点集合からvを削除する操作に言い換えられます。(細かい条件はあるが)
全ての点集合について一つ点を削除することができれば成功で、これは二部マッチング問題です。

Codeforces Round #527 (Div. 3)

https://codeforces.com/contest/1092

だいぶ調子良かった。

A
WA on test1やったw
B
sort
C
長さN-1の文字列がほぼ答え。
D1
解いてないけど偶奇は見えた。
D2
一番短いものからやっていって、連結サイズが奇数になったらダメ。
E
これとけたのいいねえ。ある一つの点にすべての木をつなげればいいことがわかります。つなげるのは中心同士です。
F
一応全方位木DPなのか...?

Eが非自明感あったけど解けてよかったね。

2018-2019 Russia Open High School Programming Contest, J: Two Prefixes

https://codeforces.com/contest/1090/problem/J

考察有りライブラリ使いまくりで楽しい。
まず文字数を固定します。するとTを少しずつずらした時何通り同じ文字列があるかみたいな問題になります。
こんな感じです。

Tを1文字shift
S:aadaa   |
T: aaaaaba|
文字列はaaaaaaba
↓
Tを2文字shift
S:aadaa   |
T:  aaaaab|a
文字列はaaaaaaab

i文字shiftした時の文字列をDiとしてDiとDjが同じ場合は辺を張るようにしてグラフを作ります。
i < jとして、DiからつながっているDjを考えたいです。するとj-i = lずれた先でも同じということは文字列Tがcyclicになっていることを表します。
よってDiがDjと繋がる条件はTがl周期の文字列でありかつS[i,i+l]=T[0,l]となります。
するとDiとつながっているDjのうちjが最小のものをjmin、jmin-i=lminとすれば、Diはj=i+lmin,i+2*lmin,i+3*lmin...としかつながりません。
さらに、S[i,i+l]=T[0,l]の条件も合わせて考えれば、Diから辺を貼るのはDjminのみで良いことがわかります。
こうして作ったグラフは木なので結局(グラフの頂点数-辺の数)で異なる文字列の数がわかります。
あとは文字数で固定するのではなくshiftの文字数で固定してiterationを回せばできます。
高速化ですが、S[i,i+l]=T[0,l]を判定するのはSuffix array, cyclicになっているかはMP法を使えばいいです。計算量は全体でO(NlogN)で済みます。

int N, M;
string S, T;

int fd(const vi& vec, int a) {
	return upper_bound(all(vec), a) - vec.begin();
}

void solve() {
	cin >> S >> T;
	vi vt = MP(T);
	int N = sz(S), M = sz(T);

	SA sa; 
	vi vs;
	rep(i, 0, N) vs.pb(S[i] - 'a');
	vs.pb(26);
	rep(i, 0, M) vs.pb(T[i] - 'a');
	sa.init(vs, 27);

	vi vec;
	rep(i, 1, M + 1) {
		if(vt[i]) {
			vec.pb(i - vt[i]);
		}
	}
	ll res = 1ll * N * M;
	rep(i, 1, N) {
		int d = sa.common(i, N + 1);
		res -= fd(vec, d);
	}
	cout << res << "\n";
}

SRM埋め(4)

わりとeasyうまくなってきたし、easyとmediamともに残っているセットを残しておきたいので、mediam練習します。

SRM 732 mediam, hard
2問ともsurreal numberとかいう競プロではあまり馴染みのない道具を使う。知ってる人は一瞬だけど知らない人は絶対解けない。さらにテストケースが弱かったらしく、hardで嘘解法が通ったらしい。ひどいね。topcoderさんこういうのだけはやめてください。

SRM 731 med
勉強になった。式が出てきてなかなかO(K^3)から改善できなかったんですが、うまく期待値に言い換えなおすと出来ました。出てきたものを精査するのは基本中の基本ですができてなかったね。

SRM 730 med
完全にごり押してしまった…。それっぽい辺張ってdp復元。もっとうまい方針でやりたかった。

SRM 726 med
よくあるやつ。重心(2つあるならどっちでも良い)からtourして最後に重心と隣の点で終わればいいです。

最小全域木

この記事は
https://adventar.org/calendars/3598
の6日目の記事として書かれました。
昨日の記事はsatosさんの独断と偏見による根津/本郷飯事情でした。

19erのomochana2というものです。
最小全域木を扱う際で有効な定理を紹介したいと思います。めっちゃ数学っぽい話になって申し訳ないです。結果だけ知りたかったら四角で囲ってある部分をサーっと読んでください。一番下に定理を使って解ける演習問題も置いといたので、よかったら解いてください。

要は、辺が最小全域木に含まれたり含まれなかったりするための条件を考えようぜって話です。
カット特性

辺のコストが全て異なるとする。 S空集合でも V全体でもない点の部分集合であるとし、辺 e=(v,w)は端点の一方が Sに他方が V-Sに属する辺のうちでコストが最小のものであるとする。すると、どの最小全域木も辺 eを含む。

図にするとこうなっています。
ここで辺 eのコストは e',fよりも小さいです。

軽く証明します。 e最小全域木に含まれていないとします。すると、 e'のような、 S V-Sにまたがり、かつ vから wへのパス上(図でオレンジ色で示してあります)にある辺が存在します。 e'を削除して、 eを追加しましょう。すると新しいグラフも全域木となり、元の全域木よりもコストが下がりました。これは仮定と矛盾するので証明完了です。
簡単に言えば eと、ある S V-Sにまたがる辺を交換しているわけですが、またがってさえすればどんな辺でもいいわけではないことです。実際 e fを交換してしまうと、閉路ができてしまい、全域木ではなくなってしまいます。

この定理を利用するとKruskal法やPrim法の正当性が出来ますが、ここでは割愛します。

閉路特性

辺のコストは全て異なるとする。 C Gの任意の閉路とし、 Cに属する辺で最もコストの大きい辺を eとする。このとき eはGのどの最小全域木にも属さない。

カット特性は最小全域木に含まれる辺の条件だったのに対し、閉路特性は最小全域木に含まれない辺の条件です。これもカット特性のように辺を交換することによって証明できるので考えてみてください。

カット特性と閉路特性の合わせ技
ここからがアツいです。上の2つの定理を使うとこんなことが言えます。

辺のコストは全て異なるとする。辺 e=(v,w)について、  eよりコストの小さい辺のみからなるパス P v wを結ぶことができる \Leftrightarrow  e G最小全域木に含まれない。

証明.

  1.  eよりコストの小さい辺のみからなるパス P v wを結ぶことができる。 \Rightarrow  e G最小全域木に含まれない。
  2.  eよりコストの小さい辺のみからなるパスで v wを結ぶことができない。 \Rightarrow  e G最小全域木に含まれる。

この1,2が示されれば証明できたことになります。 まず、 P eを加えると eがコスト最大であるような閉路が得られるため、閉路特性から e G最小全域木には含まれません。これで1は示されました。
逆に v w eよりコストの小さい辺のみからなるパスで結ぶことができないとします。点の集合 Sを、 eよりコストの小さな辺のみからなるパスで vから到達可能な全ての点の集合とします。すると、仮定から w \in V - Sです。また、 Sの定義から、一方の端点xが Sに属し、他方yが V-Sに属して、eよりコストの小さい辺 fは存在しません。もしそのような辺が存在したとすると、 x eよりコストの小さい辺のみからなるパスで vから到達可能であるので、 yもまた到達可能になり、 Sの定義に属するからです。これによりカット特性を使えば、2も示されたので証明完了です。

コストが同じ辺がある場合
コストが全て異なるなら場合分けが、

  1.  eよりコストの小さい辺のみからなるパス P v wを結ぶことができる。
  2.  eよりコストの小さい辺のみからなるパスで v wを結ぶことができない。
    の2つでよかったんですが、コストが同じ辺がある場合は、
  3.  e未満のコストの辺のみからなるパス P v wを結ぶことができる。
  4.  e未満のコストの辺のみからなるパスで v wを結ぶことは出来ないが、 e以下のコストの辺のみからなるパス P'では v wを結ぶことができる。
  5.  e以下のコストの辺のみからなるパスで v wを結ぶことができない。

と3つになります。ここで1と3、2と5が対応していることに注意します。

実は3と5は1,2の証明をほぼそのまま適用できます。よって結果も同じです
問題は4ですが、もし e最小全域木に含まれていないとするなら、最小全域木上のパス Q eとコストが同じ辺 e'が存在します。もし Q上に eよりも大きい辺 fが存在するならば e fを交換することによって、全域木のコストを下げることが出来てしまい矛盾します。よって Qにはコストが e以下の辺しかないことになりますが、4の仮定により、 e未満のコストの辺のみからなるパスは存在しないため、全域木の全ての点が互いに到達可能であるという条件から e'が存在します。よって e e'を交換することによって、 e最小全域木に含めることができました。
 e最小全域木に含まれているとすると、 P'上の eとコストが同じで、最小全域木上にない辺 e'が存在するので、これを eと交換すれば e最小全域木から除外できました。

以上より、4が成り立つときは、全ての最小全域木には eは含まれないが、 eを含む最小全域木は存在する、となります。証明できたことをまとめると、

グラフ G=(V,E)上の辺 e=(v,w)について、

  1.  e未満のコストの辺のみからなるパス P v wを結ぶことができる。 \Rightarrow  eを含む G最小全域木は存在しない。
  2.  e未満のコストの辺のみからなるパスで v wを結ぶことは出来ないが、 e以下のコストの辺のみからなるパス P'では v wを結ぶことができる。  \Rightarrow  e G全ての最小全域木には含まれないが、 eを含む G最小全域木は存在する。
  3.  e以下のコストの辺のみからなるパスで v wを結ぶことができない。  \Rightarrow  e G全ての最小全域木に含まれる。

となります。これがおそらく一番使いやすい形になっています。

演習問題

  1. 連結グラフG(全ての点が互いに行き来可能)が与えられる。Gの特定の辺 eが指定されるので eを含むGの最小全域木が存在するかどうか O(|V|+|E|)で判定せよ
  2. 最小全域木が複数あるかどうか判定せよ
  3. "ほぼ木"が与えられる。このグラフは連結であり、 |E|=|V|+8を満たす。この時最小全域木 O(|V|)で与えよ
  4. (難)(これも紹介したかった)最小全域木の辺 |V|-1本をコスト順に並び替えたものを aとする。ある全域木の辺 |V|-1本をコスト順に並び替えたものを bとした時、全ての 0 \leq i \leq |V|-2を満たす自然数 iに対し、 a_i \leq b_iを示せ(元ネタ:http://acm-icpc.aitea.net/index.php?plugin=attach&refer=2012%2FPractice%2F%E6%A8%A1%E6%93%AC%E5%9C%B0%E5%8C%BA%E4%BA%88%E9%81%B8%2F%E8%AC%9B%E8%A9%95&openfile=MedianTree.pdf)

参考文献

  1. Jon Kleinberg, Eva Tardos(2008)「アルゴリズムデザイン」浅野 孝夫, 浅野 泰仁, 小野 孝男, 平田富夫訳, 共立出版

明日の記事はlmt-swallowさんの"Browsing History Leakage (Sniffing?) について書きます"です。楽しみですね。