给定一个 String,考虑所有 substring / interval 的过程和 CLRS 中的 rod-cutting 是非常接近的,每一个可能的 substring 其实都只是下图中的某一段。大多数问题中 substring 的结构只会比 rod-cutting 更简单,比如只切一下,或者 rod 一定从最左端开始,etc.
在做 DP 之前,仔细思考状态转移方程与递推关系式(optimal substructure),尤其是求 min / max 的 DP,要认真考虑下到底最优解之间是不是“相邻”的。
判断一个 DP 结构的结果正确与否,要看从 base case 开始,每一次 update 的结构是否是正确解
LeetCode Hard 题。这题其实得到个能用的正确解不是难事,依照 Palindrome Patitioning I 的思路根据所有 substring 建个 dp 矩阵,然后递归也可以算,不过太慢了。在这种只要求返回最终解 int 的题里,一般都有比较妖孽的优化或者 dp,比较暴力的 divide & conquer 是不够的。
这个问题其实是在问,给定你一个 string ,虽少可以拆成几个 palindrome substring (减一).
试了几种超时/错误的解法之后,发现这题其实就是 rod cutting 的变种。
public class Solution {
public int minCut(String s) {
int n = s.length();
if(n <= 1) return 0;
boolean[][] dp = new boolean[n][n];
for(int i = 0; i < s.length(); i++){
for(int j = 0; j <= i; j++){
if(s.charAt(i) == s.charAt(j) &&( i - j <= 2 || dp[i - 1][j + 1])){
dp[i][j] = dp[j][i] = true;
}
}
}
return getMinPieces(s, dp, 0, n - 1) - 1;
}
private int getMinPieces(String s, boolean[][] isPalindrome, int start, int end){
if(start == end) return 1;
if(isPalindrome[start][end]) return 1;
int min = s.length();
for(int i = start; i < end; i++){
// 回头再看,这段其实就是未优化版的 dp 逻辑。
// 把 left 替换成 dp[],right 替换成 isPalindrome 就是 dp 了。
// 再仔细思考下的话,每一对 index 的区间 [i , j]
// 其实在递归中重复出现了许多次,并且又满足 optimal substructure.
int left = getMinPieces(s, isPalindrome, start, i);
int right = getMinPieces(s, isPalindrome, i + 1, end);
min = Math.min(min, left + right);
}
return min;
}
}
另一个尝试是直接 int[][] dp, 过了 20/28 个 test case,不过结果错误,挂在了 test case "ababbbabbaba" 上,应该返回3,这个代码返回1.
正确的minCut 是 aba|b|bbabb|aba
我的代码在检查"ababbb" 这个substring 的时候会出错,在看 a|(babbb) 的时候,我没考虑到其实 j 可以向右跳两步构造出最短的 palindrome. 目前的 DP 代码只假设了相邻一步的,导致结果不正确。
这个错误说明了:
在 Palindrome 中,依赖相邻字符的optimal substructure 只在 “某个子串是不是palindrome” 上有效。
在“最少子串数量”上,只检查相邻字符的 optimal substructure是有问题的,因为最优的 cut 可能在任意的其他位置,而不是相邻。
public class Solution {
public int minCut(String s) {
int n = s.length();
if(n <= 1) return 0;
int[][] dp = new int[n][n];
for(int i = 0; i < s.length(); i++){
for(int j = i; j >= 0; j--){
if(s.charAt(i) == s.charAt(j)){
if(i - j < 2){
dp[i][j] = dp[j][i] = 1;
} else {
int middle = dp[i - 1][j + 1];
int left = dp[i - 1][j] + 1;
int right = dp[i][j + 1] + 1;
dp[i][j] = dp[j][i] = Math.min(middle, Math.min(left, right));
}
} else {
if(i - j < 2){
dp[i][j] = dp[j][i] = 2;
} else {
int middle = dp[i - 1][j + 1] + 2;
int left = dp[i - 1][j] + 1;
int right = dp[i][j + 1] + 1;
dp[i][j] = dp[j][i] = Math.min(middle, Math.min(left, right));
}
}
}
}
return dp[0][s.length() - 1] - 1;
}
}
借鉴了论坛上的解法之后,能 AC 的代码如下:
这个代码其实是做了两个 DP. 一个是利用 palindrome substring 结构里合理的相邻 optimal substructure,构造出所有 substring 的 isPalindrome 矩阵;
另一个是关于 substring palindrome 数量的,虽然上一段代码已经说明了,我们不能只根据数量去推导 optimal substructure,因为给定 S, S + 'x' 的最优 cut 不一定相邻,因此破坏了 “相邻 optimal substructure” 的条件。
然而,如果已知 S 是 palindrome 的话,S + 'x' 一定不是 palindrome,这就是一个有效的“相邻 optimal substructure”.
在下面这段代码里,我们只有在已知一个 substring 是 palindrome 的情况下,才去利用这层递推关系式。
每一个 i 位置只会被更新一次,并且是正解,因为在每次 i 的循环中,我们检查了所有可能的 substring,并且在发现 palindrome 的情况下更新了当前 i 的最小值。
在每一个位置 i 上,左边都是之前的 dp 计算好的,右边都是在循环中自己检查的,每个位置的最优解是两段拼接的结果。
public class Solution {
public int minCut(String s) {
if(s == null || s.length() <= 1) return 0;
int len = s.length();
boolean[][] isPalindrome = new boolean[len][len];
int[] dp = new int[len];
for(int i = 0; i < len; i++){
dp[i] = i;
for(int j = 0; j <= i; j++){
if(s.charAt(i) == s.charAt(j) && (i - j < 2 || isPalindrome[j + 1][i - 1])){
isPalindrome[i][j] = isPalindrome[j][i] = true;
if(j == 0){
dp[i] = 0;
} else {
dp[i] = Math.min(dp[i], dp[j - 1] + 1);
}
}
}
}
return dp[len - 1];
}
}