查找一个字符串的最长回文子串的线性算法。

Manacher算法

部分转载自：http://blog.csdn.net/dyx404514/article/details/42061017

概述

Manacher算法是查找一个字符串的最长回文子串的线性算法。

在介绍算法之前，首先介绍一下什么是回文串，所谓回文串，简单来说就是正着读和反着读都是一样的字符串，比如abba，noon等等，一个字符串的最长回文子串即为这个字符串的子串中，是回文串的最长的那个。

Manacher算法的原理与实现

下面介绍Manacher算法的原理与步骤。

首先，Manacher算法提供了一种巧妙地办法，将长度为奇数的回文串和长度为偶数的回文串一起考虑，具体做法是，在原字符串的每个相邻两个字符中间插入一个分隔符，同时在首尾也要添加一个分隔符，分隔符的要求是不在原串中出现，一般情况下可以用#号。下面举一个例子：

Len数组简介与性质

Manacher算法用一个辅助数组Len[i]表示以字符T[i]为中心的最长回文字串的最右字符到T[i]的长度，比如以T[i]为中心的最长回文字串是T[l,r],那么Len[i]=r-i+1。

对于上面的例子，可以得出Len[i]数组为:

Len数组有一个性质，那就是Len[i]-1就是该回文子串在原字符串S中的长度，至于证明，首先在转换得到的字符串T中，所有的回文字串的长度都为奇数，那么对于以T[i]为中心的最长回文字串，其长度就为2*Len[i]-1,经过观察可知，T中所有的回文子串，其中分隔符的数量一定比其他字符的数量多1，也就是有Len[i]个分隔符，剩下Len[i]-1个字符来自原字符串，所以该回文串在原字符串中的长度就为Len[i]-1。

有了这个性质，那么原问题就转化为求所有的Len[i]。下面介绍如何在线性时间复杂度内求出所有的Len。

Len数组的计算

首先从左往右依次计算Len[i]，当计算Len[i]时，Lenj已经计算完毕。设P为之前计算中最长回文子串的右端点的最大值，并且设取得这个最大值的位置为po，分两种情况：

第一种情况：i<=P

那么找到i相对于po的对称位置，设为j，那么如果Len[j]<P-i，如下图：

那么说明以j为中心的回文串一定在以po为中心的回文串的内部，且j和i关于位置po对称，由回文串的定义可知，一个回文串反过来还是一个回文串，所以以i为中心的回文串的长度至少和以j为中心的回文串一样，即Len[i]>=Len[j]。因为Len[j]<P-i,所以说i+Len[j]<P。由对称性可知Len[i]=Len[j]。

如果Len[j]>=P-i,由对称性，说明以i为中心的回文串可能会延伸到P之外，而大于P的部分我们还没有进行匹配，所以要从P+1位置开始一个一个进行匹配，直到发生失配，从而更新P和对应的po以及Len[i]。

第二种情况: i>P

如果i比P还要大，说明对于中点为i的回文串还一点都没有匹配，这个时候，就只能老老实实地一个一个匹配了，匹配完成后要更新P的位置和对应的po以及Len[i]。

时间复杂度分析

Manacher算法的时间复杂度分析和Z算法类似，因为算法只有遇到还没有匹配的位置时才进行匹配，已经匹配过的位置不再进行匹配，所以对于T字符串中的每一个位置，只进行一次匹配，所以Manacher算法的总体时间复杂度为O(n)，其中n为T字符串的长度，由于T的长度事实上是S的两倍，所以时间复杂度依然是线性的。

下面是算法的实现，注意，为了避免更新P的时候导致越界，我们在字符串T的前增加一个特殊字符，比如说‘$’,所以算法中字符串是从1开始的。

public class Solution2 {
	private String s;//原字符串
	private char[] temp;//转换后的字符数组
	private int[] len;
	
	public String Manacher(String str) {
		s = str;
		ChangeToTemp();// 将s转换为temp数组
		len = new int[2 * s.length() + 3];
		int max = 0;//max为当前回文串最右边字符的最大值
		int p0 = 0;//p0为当前回文字符串的中间值
		for(int i = 1; i < 2 * s.length() + 3; i++) {
			if(max > i)
				len[i] = Math.min(max - i, len[2 * p0 - i]);//在len[j]和max-i中取小值
			else 
				len[i] = 1;//如果i>max，要从头开始匹配
			while((i - len[i]) > 0 && (i + len[i]) < 2 * s.length() + 3 && temp[i - len[i]] == temp[i + len[i]])
				len[i]++;
			if(len[i] + i > max) {//若新计算的回文串右端点的位置大于max，就要更新p0和max的值
				max = len[i] + i;
				p0 = i;
			}
		}
		
		//输出最长回文串
		int lenth = 0;
		int center = 0;
		for(int i = 0; i < len.length; i++) {
			if(len[i] > lenth) {
				lenth = len[i];
				center = i;
			}
		}
		return s.substring((center - lenth) / 2, (center - 1 + lenth) / 2);
	}
	
	private void ChangeToTemp() {
		temp = new char[s.length() * 2 + 3];
		temp[0] = '$';//为字符数组开头增加一个特殊字符，防止越界
		for(int i = 0; i < s.length(); i++) {
			temp[2 * i + 1] = '#';
			temp[2 * i + 2] = s.charAt(i);
		}
		temp[2 * s.length() + 1] = '#';
		temp[2 * s.length() + 2] = '*';//结尾加一个特殊字符，防止越界
	}
}

拓展

中心扩展算法

马拉车算法是一个非同寻常的算法，在45分钟的编码时间内提出这个算法将会是一个不折不扣的挑战，这里我们也提供另一种算法：中心扩展算法。

事实上，只需使用恒定的空间，我们就可以在 O(n²) 的时间内解决这个问题。

我们观察到回文中心的两侧互为镜像。因此，回文可以从它的中心展开，并且只有 2n - 1 个这样的中心。

你可能会问，为什么会是 2n - 1 个，而不是 n 个中心？原因在于所含字母数为偶数的回文的中心可以处于两字母之间（例如 “abba” 的中心在两个 ‘b’ 之间）。

Class Solution{
    public String longestPalindrome(String s) {
        if (s == null || s.length() < 1) return "";
        int start = 0, end = 0;
        for (int i = 0; i < s.length(); i++) {
            int len1 = expandAroundCenter(s, i, i);
            int len2 = expandAroundCenter(s, i, i + 1);
            int len = Math.max(len1, len2);
            if (len > end - start) {
                start = i - (len - 1) / 2;
                end = i + len / 2;
            }
        }
        return s.substring(start, end + 1);
    }

    private int expandAroundCenter(String s, int left, int right) {
        int L = left, R = right;
        while (L >= 0 && R < s.length() && s.charAt(L) == s.charAt(R)) {
            L--;
            R++;
        }
        return R - L - 1;
    }
}

时间复杂度：O(n²)，由于围绕中心来扩展回文会耗去 O(n) 的时间，所以总的复杂度为O(n²) 。

Manacher算法

Manacher算法

概述

Manacher算法的原理与实现

时间复杂度分析

拓展

中心扩展算法

谢谢大爷~