字符串处理 – hahaschool

Codeforces 666C Codewords

October 12, 20162016-10-12hahaschoolLeave a comment

题意

已知一个字符串 $s$ ，有 $m$ 个询问需要你回答。

对于每个询问，有两种可能性：

1型：给你另外一个字符串 $s'$ ，然后令 $s = s'$ 。（即用新串更新当前的 $s$ ）
2型：给你一个整数 $n$ ，你要回答：可以构造多少种不同的长度为 $n$ 的字符串 $p$ ，使得字符串 $s$ 是字符串 $p$ 的一个子序列，只考虑英文小写字母.

进一步解释：

子序列：假如有一个字符串 $a$ ，我们去掉其中的一些字母（只能“去掉”，而不能交换字母的位置），得到另外一个串 $b$ ，我们把 $b$ 称为 $a$ 的子序列。
举个例子： $"hhhl"$ 可以是 $"hahaschool"$ 的子序列， $"sik"$ 可以是 $"suika"$ 的子序列。

思路

首先，你需要注意到其实字符串 $s$ 的内容并不重要，影响答案的是字符串 $s$ 的长度。

我们来考虑这样的一种思路：

假设我们构造的串是 $p$ ， $s$ 是 $p$ 的子序列，我们设定： $s$ 在 $p$ 中的出现位置必须是字典序最小的。直白一点的说法： $s$ 是 $p$ 删除一些字母得到的，我们强制删除字母的时候，在连续相同的一段字母中，必须从右往左删。

举两个例子方便理解这种想法：

$s = "hahl" p = "hahaschool"$ ， $"hahl"$ 在 $"hahaschool"$ 中的对应位置必须是1、2、3、10（下标从1开始）。

$s = "abad" p = "aaabbbaaaddd"$ ， $"abad"$ 在 $"aaabbbaaaddd"$ 中的对应位置必须是1、4、7、10（下标从1开始）。

有了这种想法我们就可以把s在固定的p中的对应位置关系唯一地确定下来。同时我们得到了这样的结论：

假设s的每一位在p中对应的位置为 $p_i$ ，字符串s的内容是 $s_i$ ，那么 $s_{k+1}$ 一定不会出现在p的第 $p_k$ 位到 $p_{k+1}-1$ 位，因为如果不这样的话， $s$ 在 $p$ 中的出现位置就不是“字典序最小”的了。

有了这个结论，我们就有了初步的想法，我们首先选择 $s$ 在 $p$ 中的出现位置，这个很简单，就是 $\binom{n}{|s|}$ （其中n是要构造的p的长度，|s|是s的长度），接下来，对于每种s在p中出现位置的分布，在第 $p_{|s|}$ 位之前的未填充空位，都可以填入25种字母（参见我们刚才得到的结论），在之后的空位，都可以任意填入26种字母。

这样，如果我们枚举s在p中出现的最后位置 $p_{|s|}$ （下面用k表示），我们就可以算出答案，使用下面这个式子：

$ans=\sum_{k=|s|}^{n}\binom{k-1}{|s|-1}25^{k-|s|}26^{n-k}$

很显然如果直接拿这个式子出答案是 $O(n^2)$ 的，不满足时间限制，我们要想些办法。

观察一下上面的式子我们可以发现，可以提出 $26^n$ 这一项，这样对于相同的 $|s|$ ，不同的n的询问，我们只需要做一次 $O(n)$ 的计算就可以全数回答。这提醒我们离线处理询问：把所有询问按照|s|为第一基准，n 为第二基准进行排序，依序处理，再按出现顺序排序，依序输出。

这样做是可行的，因为 $|s|$ 最多有 $\sqrt{n}$ 种（考虑极端情况： ${|s|}_1 = 1$ , ${|s|}_2 = 2$ , ${|s|}_3 = 3$ ,…，根据等差数列求和公式，项数最多只能到 $\sqrt{100000}$ ），对于每种不同的 $|s|$ 都要做一个 $O(n)$ 的处理，所以总复杂度为 $O(n\sqrt{n})$ ，符合题目限制。

至此本题圆满解决。

实现

#define REP(i,t) for(int i = 0;i < t; i++)
#define REP_1(i,t) for(int i = 1;i <= t; i++)
#define CASE_LOOP int ___;scanf(" %d",&___);for(int __ = 1; __ <= ___; __++)
#define FOR_EDGE(i,u) for (int i = head[u]; i; i = nxt[i])
#define ADHOC_CIN(typ,name) typ name;cin >> name;

using namespace std;

typedef long long LL;

int n;
string cur;

const int MAXN = 100005, MODER = 1000000007;
LL fac[MAXN],fac_inv[MAXN];
LL fac26[MAXN],fac25[MAXN];
LL fac26_inv[MAXN],fac25_inv[MAXN];
LL get_mod(LL a){
    if(a >= MODER || a < 0) a %= MODER;
    if(a < 0) a += MODER;
    return a;
}

LL mul_mod(LL a,LL b){
    return get_mod(get_mod(a)*get_mod(b));
}

LL pow_mod(LL a,LL p){
    LL ret = 1;
    while (p) {
        if(p&1) ret = mul_mod(ret, a);
        a = mul_mod(a, a);
        p >>= 1;
    }
    return ret;
}

LL sum_mod(LL a,LL b){
    return get_mod(get_mod(a) + get_mod(b));
}

LL inv_mod(LL a){
    return pow_mod(a, MODER-2);
}

void prep(){
    fac[0] = fac_inv[0] = fac26[0] = fac25[0] = fac26_inv[0] = fac25_inv[0] =  1;
    REP_1(i, MAXN-1){
        fac[i] = mul_mod(fac[i-1], i);
        fac_inv[i] = mul_mod(fac_inv[i-1], inv_mod(i));
        fac26[i] = mul_mod(fac26[i-1], 26);
        fac25[i] = mul_mod(fac25[i-1], 25);
        fac26_inv[i] = mul_mod(fac26_inv[i-1], inv_mod(26));
        fac25_inv[i] = mul_mod(fac25_inv[i-1], inv_mod(25));
    }
}

LL C(LL n,LL r){
    return mul_mod(fac[n], mul_mod(fac_inv[r], fac_inv[n-r]));
}

struct Query{
    int id,len,qrn;
    LL res;
} query[MAXN];

bool cmp_qrn(const Query &a,const Query &b){
    if(a.qrn == b.qrn) return a.len < b.len;
    return a.qrn < b.qrn;
}

bool cmp_id(const Query &a,const Query &b){
    return a.id < b.id;
}

int tot = 0;

void solve(){
    sort(query, query+tot, cmp_qrn);
    int cqrn = 0,ccur = 0;
    LL cval = 0;
    REP(i,tot){
        if(query[i].len < query[i].qrn){
            query[i].res = 0;
            continue;
        }
        if(query[i].qrn != cqrn){
            ccur = cqrn = query[i].qrn;
            ccur--;
            cval = 0;
        }
        while(ccur < query[i].len){
            ccur++;
            cval = sum_mod(cval, mul_mod(mul_mod(mul_mod(fac25[ccur], fac25_inv[cqrn]), fac26_inv[ccur]), C(ccur-1,cqrn-1)));
        }
        query[i].res = mul_mod(cval, fac26[query[i].len]);
    }

    sort(query, query+tot, cmp_id);
    REP(i, tot){
        cout << query[i].res << endl;
    }
}

int main(int argc, const char * argv[]){
    prep();
    cin >> n >> cur;
    REP_1(i, n){
        ADHOC_CIN(int, op);
        if(op == 1){
            cin >> cur;
        }else{
            ADHOC_CIN(int, a);
            query[tot] = {tot++,a,(int)cur.size(),0};
        }
    }
    solve();
    return 0;
}

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

#define REP(i,t) for(int i = 0;i < t; i++)

#define REP_1(i,t) for(int i = 1;i <= t; i++)

#define CASE_LOOP int ___;scanf(" %d",&___);for(int __ = 1; __ <= ___; __++)

#define FOR_EDGE(i,u) for (int i = head[u]; i; i = nxt[i])

#define ADHOC_CIN(typ,name) typ name;cin >> name;

using namespace std;

typedef long long LL;

int n;

string cur;

const int MAXN = 100005, MODER = 1000000007;

LL fac[MAXN],fac_inv[MAXN];

LL fac26[MAXN],fac25[MAXN];

LL fac26_inv[MAXN],fac25_inv[MAXN];

LL get_mod(LL a){

if(a >= MODER || a < 0) a %= MODER;

if(a < 0) a += MODER;

return a;

}

LL mul_mod(LL a,LL b){

return get_mod(get_mod(a)*get_mod(b));

}

LL pow_mod(LL a,LL p){

LL ret = 1;

while (p) {

if(p&1) ret = mul_mod(ret, a);

a = mul_mod(a, a);

p >>= 1;

}

return ret;

}

LL sum_mod(LL a,LL b){

return get_mod(get_mod(a) + get_mod(b));

}

LL inv_mod(LL a){

return pow_mod(a, MODER-2);

}

void prep(){

fac[0] = fac_inv[0] = fac26[0] = fac25[0] = fac26_inv[0] = fac25_inv[0] = 1;

REP_1(i, MAXN-1){

fac[i] = mul_mod(fac[i-1], i);

fac_inv[i] = mul_mod(fac_inv[i-1], inv_mod(i));

fac26[i] = mul_mod(fac26[i-1], 26);

fac25[i] = mul_mod(fac25[i-1], 25);

fac26_inv[i] = mul_mod(fac26_inv[i-1], inv_mod(26));

fac25_inv[i] = mul_mod(fac25_inv[i-1], inv_mod(25));

}

LL C(LL n,LL r){

return mul_mod(fac[n], mul_mod(fac_inv[r], fac_inv[n-r]));

}

struct Query{

int id,len,qrn;

LL res;

} query[MAXN];

bool cmp_qrn(const Query &a,const Query &b){

if(a.qrn == b.qrn) return a.len < b.len;

return a.qrn < b.qrn;

}

bool cmp_id(const Query &a,const Query &b){

return a.id < b.id;

}

int tot = 0;

void solve(){

sort(query, query+tot, cmp_qrn);

int cqrn = 0,ccur = 0;

LL cval = 0;

REP(i,tot){

if(query[i].len < query[i].qrn){

query[i].res = 0;

continue;

}

if(query[i].qrn != cqrn){

ccur = cqrn = query[i].qrn;

ccur--;

cval = 0;

}

while(ccur < query[i].len){

ccur++;

cval = sum_mod(cval, mul_mod(mul_mod(mul_mod(fac25[ccur], fac25_inv[cqrn]), fac26_inv[ccur]), C(ccur-1,cqrn-1)));

}

query[i].res = mul_mod(cval, fac26[query[i].len]);

}

sort(query, query+tot, cmp_id);

REP(i, tot){

cout << query[i].res << endl;

}

int main(int argc, const char * argv[]){

prep();

cin >> n >> cur;

REP_1(i, n){

ADHOC_CIN(int, op);

if(op == 1){

cin >> cur;

}else{

ADHOC_CIN(int, a);

query[tot] = {tot++,a,(int)cur.size(),0};

}

solve();

return 0;

}

BZOJ 2780 / SPOJ JZPGYZ Sevenk Love Oimaster

September 04, 20152015-09-04hahaschoolLeave a comment

题意

给出一系列的字符串，我们把这些串叫母串，然后给你若干字符串，对于每一个字符串，你要求出在多少个母串中可以找到和给出的字符串相同的母串的字串。

思路

子串问题，要借助后缀系列解决，这个题使用了后缀自动机。但是通常意义的后缀自动机都是针对一个母串建立的，现在我们手里有一堆母串，这时候就需要我们进行活用，来创建“广义后缀自动机”，这个自动机将可以接受母串集合里所有的字串。

广义后缀自动机的建立方法其实是在一般的自动机创建基础之上，增加了一些东西。构造后缀自动机的方法是增量法，构造广义后缀自动机的方法也是一样的，但是我们从第个二串开始，一位一位增量的时候，我们有可能会用到构造到一半的自动机的某些节点或者某些转移边。对于当前将要加入的mxn(最长可接受字串长度)值，和当前追加节点时的last，如果last有一条转移边可以用，而且即将加入的新节点的mxn值正好等于last的mxn+1，这说明既存的节点和我们将要加入的节点是等价的，这一轮的追加到这里就可以结束了。如果存在转移边，但是转移边连着的节点mxn值并不是last的mxn+1，这个时候就需要我们使用在平常构造后缀自动机中使用的“拆点”方法。复制既存的节点作为符合我们mxn要求的节点，调整parent关系和所有自动机上父亲节点的转移关系，就像我们在平常构造自动机时为了防止mxn异常缩短采用的“拆点”方法一样。如果last节点不存在可用的转移边，这时候按照普通的增量法处理就可以。(如果觉得费解，不妨直接参考我的MultiSAM_Append()方法)。

创建完广义后缀自动机，这还只是个开始。接下来我们要提取出自动机中的所有的parent关系，创建parent树。我们注意到，在parent树中，一个节点的子树代表的是以这个节点为后缀的全部字串。举个例子就是，对于“banana”的”ana”代表节点(mxn值3)，他的子树就代表了”ana“,”nana“,”bana“,”anana“,”banana“，这一系列字串。这一特性有什么用呢？

注意到题意，我们要找到给出的串在多少个串中匹配，如果我们按照正常的方法在广义后缀自动机上完整地匹配这个串（如果匹配有中断，那就说明这个串不存在于母串集合的字串当中），这个时候转移到的最终状态对应节点的parent树的子树，就是在母串集合中所有的以给出的串为后缀的字串。如果我们给parent树上的每一个节点挂一个列表，标记这个节点都被哪些字符串利用了，这样只要我们逐一统计子树中的每一个节点，就可以知道当前给出的串在几个母串中存在，问题就可以解决了。

但是对于每一棵子树都统计一次，复杂度很大，显然需要再优化。优化的方法就是“DFS序把树压平”然后“离线处理”。首先遍历parent树，纪录每一个节点进入时的DFN和出去时的DFN，从进去到出去这两个DFN之间的所有节点(包括出入两个节点)显然就是parent的子树了。现在我们的问题就转变为了在某个数组上一段给定的区间求有多少个不同的数字，而且还是离线处理，这种问题可以使用一种O(n)的处理方法，详情可以参考BZOJ 1878 HH的项链。

问题到了这里，终于是完美地解决了。

代码

#include <iostream>
#include <algorithm>
#include <queue>
#include <vector>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <cstring>
#include <ctime>
#include <iomanip>
#include <cmath>
#include <set>
#include <stack>
#include <cmath>
#include <map>

using namespace std;

const int MAXN = 200010;

int tot = 0;

#pragma mark - Binary Indexed Tree (BIT) 1D
//index begins from ONE
//init:memset BIT,set BIT_size
int BIT[MAXN];//container,may need to adjust MAXN or type.assuming the index won't overflow int
int BIT_size;//should assign when use

inline int lowbit(int a){
    return a & (-a);
}

void BIT_modify(int pos,int delta){//type of delta may need to modify
    for (int x = pos; x <= BIT_size; x += lowbit(x)) {
        BIT[x] += delta;
    }
}

int BIT_sum(int pos){//return type may alter
    int ret = 0;
    for (int x = pos; x > 0; x -= lowbit(x)) {
        ret += BIT[x];
    }
    return ret;
}
#pragma mark -

struct Graph{//Chained Linear Edges
    int head[MAXN];
    int next[MAXN];
    int to[MAXN];
    inline void addEdge(int _from,int _to){
        static int q = 1;//!!
        to[q] = _to;
        next[q] = head[_from];
        head[_from] = q++;
    }
} parentTree,idx;

struct Query{
    int id,ans,from,to;
} query[60010];

bool cmp1(const Query &a,const Query &b){
    return a.to < b.to;
}

bool cmp2(const Query &a,const Query &b){
    return a.id < b.id;
}


struct SAM_State{
    int mxn;
    int id;
    SAM_State *to[26];
    SAM_State *parent;
    SAM_State(int _mxn){
        mxn = _mxn;
        id = ++tot;
        memset(to, 0, sizeof(to));
        parent = NULL;
    }
} *state[MAXN];

SAM_State* SAM_Append(SAM_State *last,SAM_State *root,int ch){
    SAM_State *p = last;
    SAM_State *np = new SAM_State(p -> mxn + 1);
    state[np -> id] = np;
    while (p && p -> to[ch] == NULL) {
        p -> to[ch] = np;
        p = p -> parent;
    }
    if (p != NULL) {
        SAM_State *q = p -> to[ch];
        if (q -> mxn == p -> mxn + 1) {
            np -> parent = q;
        }else{
            SAM_State *nq = new SAM_State(p -> mxn + 1);
            state[nq -> id] = nq;
            nq -> parent = q -> parent;
            q -> parent = nq;
            np -> parent = nq;
            memcpy(nq -> to, q -> to, sizeof(q -> to));
            while (p && p -> to[ch] == q) {
                p -> to[ch] = nq;
                p = p -> parent;
            }
        }
    }else{
        np -> parent = root;
    }
    last = np;
    return last;
}

SAM_State* MultiSAM_Append(SAM_State *last, SAM_State *root,int ch){
    SAM_State *p = last;
    if (p -> to[ch] != NULL) {
        SAM_State *q = p -> to[ch];
        if (q -> mxn == p -> mxn + 1) {
            last = q;
        }else {
            SAM_State *nq = new SAM_State(p -> mxn + 1);
            state[nq -> id] = nq;
            nq -> parent = q -> parent;
            q -> parent = nq;
            memcpy(nq -> to, q -> to, sizeof(q -> to));
            while (p && p -> to[ch] == q) {
                p -> to[ch] = nq;
                p = p -> parent;
            }
            last = nq;
        }
    }else{
        return SAM_Append(last, root, ch);
    }
    return last;
}

void MultiSAM_Build(int num,char* str,SAM_State *root){
    SAM_State *last = root;
    int len = (int)strlen(str);
    for (int i = 0; i < len; i++) {
        last = MultiSAM_Append(last, root, str[i] - 'a');
        idx.addEdge(last -> id, num);
    }
}

SAM_State* SAM_Match(char *str,SAM_State *root){//only for this problem
    SAM_State *sam = root;
    int len = (int)strlen(str);
    for (int i = 0; i < len; i++) {
        if (sam -> to[str[i] - 'a']) {
            sam = sam -> to[str[i] - 'a'];
        }else{
            return NULL;
        }
    }
    return sam;
}

int in[MAXN],out[MAXN],seq[MAXN],dfn = 0;//dfn begins from 1
void dfs_getdfn(int cur){
    in[cur] = ++dfn;
    seq[dfn] = cur;
    for (int i = parentTree.head[cur]; i; i = parentTree.next[i]) {
        dfs_getdfn(parentTree.to[i]);
    }
    out[cur] = dfn;
}

char container[360010];
int prv[MAXN];
int main(){
    int n,m;
    scanf(" %d %d",&n,&m);
    state[1] = new SAM_State(0);
    for (int i = 1; i <= n; i++) {
        scanf(" %s",container);
        MultiSAM_Build(i,container, state[1]);
    }

    for (int i = 1; i <= tot; i++) {
        if (state[i] -> parent) {
            parentTree.addEdge(state[i] -> parent -> id, state[i] -> id);
        }
    }
    dfs_getdfn(1);
    for (int i = 1; i <= m; i++) {
        scanf(" %s",container);
        SAM_State *pos = SAM_Match(container, state[1]);
        if (pos != NULL) {
            query[i].id = i;
            query[i].from = in[pos -> id];
            query[i].to = out[pos -> id];
        }else{
            query[i].id = i;
            query[i].from = -1;
            query[i].to = -1;
        }
    }
    sort(query+1, query+1+m, cmp1);

    BIT_size = tot;
    int k = 1;
    while (query[k].to == -1) {
        k++;
    }
    for (int i = 1; i <= tot; i++) {
        for (int j = idx.head[seq[i]]; j; j = idx.next[j]) {
            if (prv[idx.to[j]]) {
                BIT_modify(prv[idx.to[j]], -1);
            }
            BIT_modify(prv[idx.to[j]] = i, 1);
        }
        for (; i == query[k].to && k <= m; k++) {
            query[k].ans = BIT_sum(query[k].to) - BIT_sum(query[k].from - 1);
        }
    }
    sort(query+1, query+1+m, cmp2);
    for (int i = 1; i <= m; i++) {
        printf("%d\n",query[i].ans);
    }

    return 0;
}

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

#include <iostream>

#include <algorithm>

#include <queue>

#include <vector>

#include <cstdlib>

#include <cstdio>

#include <string>

#include <cstring>

#include <ctime>

#include <iomanip>

#include <cmath>

#include <set>

#include <stack>

#include <cmath>

#include <map>

using namespace std;

const int MAXN = 200010;

int tot = 0;

#pragma mark - Binary Indexed Tree (BIT) 1D

//index begins from ONE

//init:memset BIT,set BIT_size

int BIT[MAXN];//container,may need to adjust MAXN or type.assuming the index won't overflow int

int BIT_size;//should assign when use

inline int lowbit(int a){

return a & (-a);

}

void BIT_modify(int pos,int delta){//type of delta may need to modify

for (int x = pos; x <= BIT_size; x += lowbit(x)) {

BIT[x] += delta;

}

int BIT_sum(int pos){//return type may alter

int ret = 0;

for (int x = pos; x > 0; x -= lowbit(x)) {

ret += BIT[x];

}

return ret;

}

#pragma mark -

struct Graph{//Chained Linear Edges

int head[MAXN];

int next[MAXN];

int to[MAXN];

inline void addEdge(int _from,int _to){

static int q = 1;//!!

to[q] = _to;

next[q] = head[_from];

head[_from] = q++;

}

} parentTree,idx;

struct Query{

int id,ans,from,to;

} query[60010];

bool cmp1(const Query &a,const Query &b){

return a.to < b.to;

}

bool cmp2(const Query &a,const Query &b){

return a.id < b.id;

}

struct SAM_State{

int mxn;

int id;

SAM_State *to[26];

SAM_State *parent;

SAM_State(int _mxn){

mxn = _mxn;

id = ++tot;

memset(to, 0, sizeof(to));

parent = NULL;

}

} *state[MAXN];

SAM_State* SAM_Append(SAM_State *last,SAM_State *root,int ch){

SAM_State *p = last;

SAM_State *np = new SAM_State(p -> mxn + 1);

state[np -> id] = np;

while (p && p -> to[ch] == NULL) {

p -> to[ch] = np;

p = p -> parent;

}

if (p != NULL) {

SAM_State *q = p -> to[ch];

if (q -> mxn == p -> mxn + 1) {

np -> parent = q;

}else{

SAM_State *nq = new SAM_State(p -> mxn + 1);

state[nq -> id] = nq;

nq -> parent = q -> parent;

q -> parent = nq;

np -> parent = nq;

memcpy(nq -> to, q -> to, sizeof(q -> to));

while (p && p -> to[ch] == q) {

p -> to[ch] = nq;

p = p -> parent;

}

}else{

np -> parent = root;

}

last = np;

return last;

}

SAM_State* MultiSAM_Append(SAM_State *last, SAM_State *root,int ch){

SAM_State *p = last;

if (p -> to[ch] != NULL) {

SAM_State *q = p -> to[ch];

if (q -> mxn == p -> mxn + 1) {

last = q;

}else {

SAM_State *nq = new SAM_State(p -> mxn + 1);

state[nq -> id] = nq;

nq -> parent = q -> parent;

q -> parent = nq;

memcpy(nq -> to, q -> to, sizeof(q -> to));

while (p && p -> to[ch] == q) {

p -> to[ch] = nq;

p = p -> parent;

}

last = nq;

}

}else{

return SAM_Append(last, root, ch);

}

return last;

}

void MultiSAM_Build(int num,char* str,SAM_State *root){

SAM_State *last = root;

int len = (int)strlen(str);

for (int i = 0; i < len; i++) {

last = MultiSAM_Append(last, root, str[i] - 'a');

idx.addEdge(last -> id, num);

}

SAM_State* SAM_Match(char *str,SAM_State *root){//only for this problem

SAM_State *sam = root;

int len = (int)strlen(str);

for (int i = 0; i < len; i++) {

if (sam -> to[str[i] - 'a']) {

sam = sam -> to[str[i] - 'a'];

}else{

return NULL;

}

return sam;

}

int in[MAXN],out[MAXN],seq[MAXN],dfn = 0;//dfn begins from 1

void dfs_getdfn(int cur){

in[cur] = ++dfn;

seq[dfn] = cur;

for (int i = parentTree.head[cur]; i; i = parentTree.next[i]) {

dfs_getdfn(parentTree.to[i]);

}

out[cur] = dfn;

}

char container[360010];

int prv[MAXN];

int main(){

int n,m;

scanf(" %d %d",&n,&m);

state[1] = new SAM_State(0);

for (int i = 1; i <= n; i++) {

scanf(" %s",container);

MultiSAM_Build(i,container, state[1]);

}

for (int i = 1; i <= tot; i++) {

if (state[i] -> parent) {

parentTree.addEdge(state[i] -> parent -> id, state[i] -> id);

}

dfs_getdfn(1);

for (int i = 1; i <= m; i++) {

scanf(" %s",container);

SAM_State *pos = SAM_Match(container, state[1]);

if (pos != NULL) {

query[i].id = i;

query[i].from = in[pos -> id];

query[i].to = out[pos -> id];

}else{

query[i].id = i;

query[i].from = -1;

query[i].to = -1;

}

sort(query+1, query+1+m, cmp1);

BIT_size = tot;

int k = 1;

while (query[k].to == -1) {

k++;

}

for (int i = 1; i <= tot; i++) {

for (int j = idx.head[seq[i]]; j; j = idx.next[j]) {

if (prv[idx.to[j]]) {

BIT_modify(prv[idx.to[j]], -1);

}

BIT_modify(prv[idx.to[j]] = i, 1);

}

for (; i == query[k].to && k <= m; k++) {

query[k].ans = BIT_sum(query[k].to) - BIT_sum(query[k].from - 1);

}

sort(query+1, query+1+m, cmp2);

for (int i = 1; i <= m; i++) {

printf("%d\n",query[i].ans);

}

return 0;

}

SPOJ SUBLEX Lexicographical Substring Search

August 20, 20152015-08-20hahaschoolLeave a comment

题意

把一个字符串所有的不同的字串全拿出来，按字典序排序，第k小的字符串是什么样子的呢？

思路

字串问题当然是后缀自动机了。对于给出的字符串，建立一个后缀自动机，然后对后缀自动机对应的状态图进行一次拓扑排序，每个节点的深度就是节点上携带的mxn(当前状态对应的字串最长为多少位)。接下来我们从深度最大的节点开始往根部处理每一个节点，我们要求出的就是对于每个能走的边，所有接下来的以这条边对应的字母开头的字串数目，而节点上面存的是节点出边的边权之和。这样我们就得到了一个处理好的图，我们只要在这个图上面搜索，逼近k值就可以了。

因为SPOJ卡常数特别严重，所以拓扑排序要使用计数排序的方法，而且要开额外的数组纪录每一个节点所有的孩子来加快之后的搜索速度。

代码

//
//  SPOJ SUBLEX.cpp
//  playground
//
//  Created by Adam Chang on 2015/08/10.
//  Copyright © 2015年 Adam Chang. All rights reserved.
//

#include <iostream>
#include <algorithm>
#include <queue>
#include <vector>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <cstring>
#include <ctime>
#include <iomanip>
#include <cmath>
#include <set>
#include <stack>
#include <cmath>
#include <map>

using namespace std;

#define MAXN 90005

struct SAM_State{
    int mxn;
    int cnt;
    int id;
    SAM_State *to[26];
    SAM_State *parent;
    void init(int _mxn){
        mxn = _mxn;
        memset(to, NULL, sizeof(to));
        parent = NULL;
        cnt = 0;
        id = 0;
    }
} idx[2*MAXN];

int totalNode = 0;
int len = 0;
SAM_State *idx_sorted[2*MAXN];

SAM_State* SAM_Append(SAM_State *last,SAM_State *root,int ch){
    SAM_State *p = last;
    SAM_State *np = &idx[++totalNode];
    np -> mxn = p -> mxn + 1;
    while (p && p -> to[ch] == NULL) {
        p -> to[ch] = np;
        p = p -> parent;
    }
    if (p != NULL) {
        SAM_State *q = p -> to[ch];
        if (q -> mxn == p -> mxn + 1) {
            np -> parent = q;
        }else{
            SAM_State *nq = &idx[++totalNode];
            *nq = *q;
            nq -> mxn = p -> mxn + 1;
            q -> parent = nq;
            np -> parent = nq;
            while (p && p -> to[ch] == q) {
                p -> to[ch] = nq;
                p = p -> parent;
            }
        }
    }else{
        np -> parent = root;
    }
    last = np;
    return last;
}

void SAM_Init(int n){
    for (int i = 0; i <= n ; i++) {
        idx[i].init(0);
    }
    totalNode = 0;
}

SAM_State* SAM_Build(char* str){
    len = (int)strlen(str);
    SAM_Init(2*len);
    SAM_State *root = &idx[0];
    SAM_State *last = root;
    for (int i = 0; i < len; i++) {
        last = SAM_Append(last, root, str[i] - 'a');
    }
    return root;
}

int cnt[MAXN*2];
void SAM_Toposort(){
    for (int i = 0; i <= totalNode; i++) {
        idx[i].id = i;
        cnt[idx[i].mxn]++;
    }
    for (int i = 1; i <= len; i++) {
        cnt[i] += cnt[i-1];
    }
    for (int i = 0; i <= totalNode; i++) {
        idx_sorted[--cnt[idx[i].mxn]] = &idx[i];
    }
}

int childID[MAXN*2][26];
int childVal[MAXN*2][26];
char childCh[MAXN*2][26];
int childCnt[MAXN*2];
void SAM_Buildgraph(){
    for (int i = totalNode; i >= 0; i--) {
        SAM_State *cur = idx_sorted[i];
        int curid = cur -> id;
        for (int j = 0; j < 26; j++) {
            if (cur -> to[j] != NULL) {
                SAM_State *nxt = cur -> to[j];
                int nxtid = nxt -> id;
                childID[curid][childCnt[curid]] = nxtid;
                childVal[curid][childCnt[curid]] = nxt -> cnt + 1;
                childCh[curid][childCnt[curid]] = j + 'a';
                cur -> cnt += nxt -> cnt + 1;
                childCnt[curid]++;
            }
        }
    }
}

char ans[MAXN];
void get_ans(int k){
    int pos = 0;
    SAM_State *cur = &idx[0];
    while (k) {
        for (int i = 0; i < childCnt[cur -> id]; i++) {
            if (childVal[cur -> id][i] < k) {
                k -= childVal[cur -> id][i];
            }else {
                k--;
                ans[pos] = childCh[cur -> id][i];
                cur = &idx[childID[cur -> id][i]];
                pos++;
                break;
            }
        }
    }
    ans[pos] = '\0';
    puts(ans);
}

char a[MAXN];
int main(){
    scanf(" %s",a);
    SAM_Build(a);
    SAM_Toposort();
    SAM_Buildgraph();
    int q = 0;
    scanf(" %d",&q);
    for (int i = 1; i <= q; i++) {
        int k = 0;
        scanf(" %d",&k);
        get_ans(k);
    }
    return 0;
}

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

// SPOJ SUBLEX.cpp

// playground

// Created by Adam Chang on 2015/08/10.

#include <iostream>

#include <algorithm>

#include <queue>

#include <vector>

#include <cstdlib>

#include <cstdio>

#include <string>

#include <cstring>

#include <ctime>

#include <iomanip>

#include <cmath>

#include <set>

#include <stack>

#include <cmath>

#include <map>

using namespace std;

#define MAXN 90005

struct SAM_State{

int mxn;

int cnt;

int id;

SAM_State *to[26];

SAM_State *parent;

void init(int _mxn){

mxn = _mxn;

memset(to, NULL, sizeof(to));

parent = NULL;

cnt = 0;

id = 0;

}

} idx[2*MAXN];

int totalNode = 0;

int len = 0;

SAM_State *idx_sorted[2*MAXN];

SAM_State* SAM_Append(SAM_State *last,SAM_State *root,int ch){

SAM_State *p = last;

SAM_State *np = &idx[++totalNode];

np -> mxn = p -> mxn + 1;

while (p && p -> to[ch] == NULL) {

p -> to[ch] = np;

p = p -> parent;

}

if (p != NULL) {

SAM_State *q = p -> to[ch];

if (q -> mxn == p -> mxn + 1) {

np -> parent = q;

}else{

SAM_State *nq = &idx[++totalNode];

*nq = *q;

nq -> mxn = p -> mxn + 1;

q -> parent = nq;

np -> parent = nq;

while (p && p -> to[ch] == q) {

p -> to[ch] = nq;

p = p -> parent;

}

}else{

np -> parent = root;

}

last = np;

return last;

}

void SAM_Init(int n){

for (int i = 0; i <= n ; i++) {

idx[i].init(0);

}

totalNode = 0;

}

SAM_State* SAM_Build(char* str){

len = (int)strlen(str);

SAM_Init(2*len);

SAM_State *root = &idx[0];

SAM_State *last = root;

for (int i = 0; i < len; i++) {

last = SAM_Append(last, root, str[i] - 'a');

}

return root;

}

int cnt[MAXN*2];

void SAM_Toposort(){

for (int i = 0; i <= totalNode; i++) {

idx[i].id = i;

cnt[idx[i].mxn]++;

}

for (int i = 1; i <= len; i++) {

cnt[i] += cnt[i-1];

}

for (int i = 0; i <= totalNode; i++) {

idx_sorted[--cnt[idx[i].mxn]] = &idx[i];

}

int childID[MAXN*2][26];

int childVal[MAXN*2][26];

char childCh[MAXN*2][26];

int childCnt[MAXN*2];

void SAM_Buildgraph(){

for (int i = totalNode; i >= 0; i--) {

SAM_State *cur = idx_sorted[i];

int curid = cur -> id;

for (int j = 0; j < 26; j++) {

if (cur -> to[j] != NULL) {

SAM_State *nxt = cur -> to[j];

int nxtid = nxt -> id;

childID[curid][childCnt[curid]] = nxtid;

childVal[curid][childCnt[curid]] = nxt -> cnt + 1;

childCh[curid][childCnt[curid]] = j + 'a';

cur -> cnt += nxt -> cnt + 1;

childCnt[curid]++;

}

char ans[MAXN];

void get_ans(int k){

int pos = 0;

SAM_State *cur = &idx[0];

while (k) {

for (int i = 0; i < childCnt[cur -> id]; i++) {

if (childVal[cur -> id][i] < k) {

k -= childVal[cur -> id][i];

}else {

k--;

ans[pos] = childCh[cur -> id][i];

cur = &idx[childID[cur -> id][i]];

pos++;

break;

}

ans[pos] = '\0';

puts(ans);

}

char a[MAXN];

int main(){

scanf(" %s",a);

SAM_Build(a);

SAM_Toposort();

SAM_Buildgraph();

int q = 0;

scanf(" %d",&q);

for (int i = 1; i <= q; i++) {

int k = 0;

scanf(" %d",&k);

get_ans(k);

}

return 0;

}

SPOJ LCS Longest Common Substring

August 09, 20152015-08-09hahaschool2 Comments

［等待填坑］

//
//  SPOJ LCS.cpp
//  playground
//
//  Created by Adam Chang on 2015/08/08.
//  Copyright © 2015年 Adam Chang. All rights reserved.
//

#include <iostream>
#include <algorithm>
#include <queue>
#include <vector>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <cstring>
#include <ctime>
#include <iomanip>
#include <cmath>
#include <set>
#include <stack>
#include <cmath>
#include <map>

using namespace std;

struct SAM_State{
    int mxn;
    SAM_State *to[26];
    SAM_State *parent;
    SAM_State(int _mxn){
        mxn = _mxn;
        memset(to, 0, sizeof(to));
        parent = NULL;
    }
};

SAM_State* SAM_Append(SAM_State *last,SAM_State *root,int ch){
    SAM_State *p = last;
    SAM_State *np = new SAM_State(p -> mxn + 1);
    while (p && p -> to[ch] == NULL) {
        p -> to[ch] = np;
        p = p -> parent;
    }
    if (p != NULL) {
        SAM_State *q = p -> to[ch];
        if (q -> mxn == p -> mxn + 1) {
            np -> parent = q;
        }else{
            SAM_State *nq = new SAM_State(p -> mxn + 1);
            nq -> parent = q -> parent;
            q -> parent = nq;
            np -> parent = nq;
            memcpy(nq -> to, q -> to, sizeof(q -> to));
            while (p && p -> to[ch] == q) {
                p -> to[ch] = nq;
                p = p -> parent;
            }
        }
    }else{
        np -> parent = root;
    }
    last = np;
    return last;
}

SAM_State* SAM_Build(string str){
    SAM_State *root = new SAM_State(0);
    SAM_State *last = root;
    for (int i = 0; i < str.size(); i++) {
        last = SAM_Append(last, root, str[i] - 'a');
    }
    return root;
}


int main(){
    string a,b;
    cin >> a >> b;
    SAM_State *sam_root = SAM_Build(a);
    SAM_State *sam = sam_root;
    int ans = 0;
    int curcnt = 0;
    for (int i = 0; i < b.size(); i++) {
        if (sam -> to[b[i]-'a'] != NULL) {
            curcnt++;
            sam = sam -> to[b[i]-'a'];
        }else{
            ans = max(curcnt,ans);
            curcnt = 0;
            while (sam -> parent) {
                sam = sam -> parent;
                if (sam -> to[b[i]-'a'] != NULL) {
                    curcnt = sam->mxn+1;
                    sam = sam -> to[b[i]-'a'];
                    break;
                }
            }
        }
    }
    cout << max(curcnt,ans) << endl;
    return 0;
}

100

101

102

103

// SPOJ LCS.cpp

// playground

// Created by Adam Chang on 2015/08/08.

#include <iostream>

#include <algorithm>

#include <queue>

#include <vector>

#include <cstdlib>

#include <cstdio>

#include <string>

#include <cstring>

#include <ctime>

#include <iomanip>

#include <cmath>

#include <set>

#include <stack>

#include <cmath>

#include <map>

using namespace std;

struct SAM_State{

int mxn;

SAM_State *to[26];

SAM_State *parent;

SAM_State(int _mxn){

mxn = _mxn;

memset(to, 0, sizeof(to));

parent = NULL;

}

};

SAM_State* SAM_Append(SAM_State *last,SAM_State *root,int ch){

SAM_State *p = last;

SAM_State *np = new SAM_State(p -> mxn + 1);

while (p && p -> to[ch] == NULL) {

p -> to[ch] = np;

p = p -> parent;

}

if (p != NULL) {

SAM_State *q = p -> to[ch];

if (q -> mxn == p -> mxn + 1) {

np -> parent = q;

}else{

SAM_State *nq = new SAM_State(p -> mxn + 1);

nq -> parent = q -> parent;

q -> parent = nq;

np -> parent = nq;

memcpy(nq -> to, q -> to, sizeof(q -> to));

while (p && p -> to[ch] == q) {

p -> to[ch] = nq;

p = p -> parent;

}

}else{

np -> parent = root;

}

last = np;

return last;

}

SAM_State* SAM_Build(string str){

SAM_State *root = new SAM_State(0);

SAM_State *last = root;

for (int i = 0; i < str.size(); i++) {

last = SAM_Append(last, root, str[i] - 'a');

}

return root;

}

int main(){

string a,b;

cin >> a >> b;

SAM_State *sam_root = SAM_Build(a);

SAM_State *sam = sam_root;

int ans = 0;

int curcnt = 0;

for (int i = 0; i < b.size(); i++) {

if (sam -> to[b[i]-'a'] != NULL) {

curcnt++;

sam = sam -> to[b[i]-'a'];

}else{

ans = max(curcnt,ans);

curcnt = 0;

while (sam -> parent) {

sam = sam -> parent;

if (sam -> to[b[i]-'a'] != NULL) {

curcnt = sam->mxn+1;

sam = sam -> to[b[i]-'a'];

break;

}

cout << max(curcnt,ans) << endl;

return 0;

}

SPOJ LCS2 Longest Common Substring II

August 09, 20152015-08-09hahaschoolLeave a comment

［详细题解等待填坑］

SPOJ真是业界奇葩

//
//  SPOJ LCS2.cpp
//  playground
//
//  Created by Adam Chang on 2015/08/08.
//  Copyright © 2015年 Adam Chang. All rights reserved.
//

#include <iostream>
#include <algorithm>
#include <queue>
#include <vector>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <cstring>
#include <ctime>
#include <iomanip>
#include <cmath>
#include <set>
#include <stack>
#include <cmath>
#include <map>

using namespace std;

struct SAM_State{
    int mxn;
    int mi;
    int mx;
    SAM_State *to[26];
    SAM_State *parent;
    void init(int _mxn){
        mxn = _mxn;
        memset(to, NULL, sizeof(to));
        parent = NULL;
        mx = 0;
        mi = 909303;
    }
} idx[200005];

int totalNode = 0;
int mxmxn = 0;
SAM_State *idx_sorted[200005];

SAM_State* SAM_Append(SAM_State *last,SAM_State *root,int ch){
    SAM_State *p = last;
    SAM_State *np = &idx[++totalNode];
    np -> mxn = p -> mxn + 1;
    mxmxn = max(mxmxn, np -> mxn);
    while (p && p -> to[ch] == NULL) {
        p -> to[ch] = np;
        p = p -> parent;
    }
    if (p != NULL) {
        SAM_State *q = p -> to[ch];
        if (q -> mxn == p -> mxn + 1) {
            np -> parent = q;
        }else{
            SAM_State *nq = &idx[++totalNode];
            *nq = *q;
            nq -> mxn = p -> mxn + 1;
            q -> parent = nq;
            np -> parent = nq;
            while (p && p -> to[ch] == q) {
                p -> to[ch] = nq;
                p = p -> parent;
            }
        }
    }else{
        np -> parent = root;
    }
    last = np;
    return last;
}

void init(int n){
    for (int i = 0; i <= n ; i++) {
        idx[i].init(0);
    }
    totalNode = 0;
    mxmxn = 0;
}

SAM_State* SAM_Build(char* str){
    int len = (int)strlen(str);
    init(2*len);
    SAM_State *root = &idx[0];
    SAM_State *last = root;
    for (int i = 0; i < len; i++) {
        last = SAM_Append(last, root, str[i] - 'a');
    }
    return root;
}

int cnt[100005];
void toposort(){
    memset(cnt, 0, sizeof(cnt));
    for (int i = 0; i <= totalNode; i++) {
        cnt[idx[i].mxn]++;
    }
    for (int i = 1; i <= mxmxn; i++) {
        cnt[i] += cnt[i-1];
    }
    for (int i = 0; i <= totalNode; i++) {
        idx_sorted[--cnt[idx[i].mxn]] = &idx[i];
    }
}



char a[100005];

int main(){
    scanf("%s",a);
    SAM_State *sam_root = SAM_Build(a);
    toposort();
    while (scanf("%s",a) != EOF) {
        int len = (int)strlen(a);
        SAM_State *sam = sam_root;
        int tmp = 0;
        for (int i = 0; i < len; i++) {
            if (sam -> to[a[i] - 'a'] != NULL) {
                tmp++;
                sam = sam -> to[a[i] - 'a'];
            }else{
                while (sam && sam -> to[a[i] - 'a'] == NULL) {
                    sam = sam -> parent;
                }
                if (sam == NULL) {
                    sam = sam_root;
                    tmp = 0;
                }else{
                    tmp = sam -> mxn + 1;
                    sam = sam -> to[a[i] - 'a'];
                }
            }
            sam -> mx = max(sam -> mx, tmp);
        }
        for (int j = totalNode; j >= 0; j--) {
            SAM_State *cur = idx_sorted[j];
            cur -> mi = min(cur -> mi, cur -> mx);
            if (cur -> parent != NULL) {
                cur -> parent -> mx = max(cur -> parent -> mx, cur -> mx);
                cur -> parent -> mx = min(cur -> parent -> mxn,cur -> parent -> mx);
            }
            cur -> mx = 0;
        }
    }
    int res = 0;
    for (int i = 0; i <= totalNode; i++) {
        res = max(idx[i].mi, res);
    }
    printf("%d\n",res);
    return 0;
}

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

// SPOJ LCS2.cpp

// playground

// Created by Adam Chang on 2015/08/08.

#include <iostream>

#include <algorithm>

#include <queue>

#include <vector>

#include <cstdlib>

#include <cstdio>

#include <string>

#include <cstring>

#include <ctime>

#include <iomanip>

#include <cmath>

#include <set>

#include <stack>

#include <cmath>

#include <map>

using namespace std;

struct SAM_State{

int mxn;

int mi;

int mx;

SAM_State *to[26];

SAM_State *parent;

void init(int _mxn){

mxn = _mxn;

memset(to, NULL, sizeof(to));

parent = NULL;

mx = 0;

mi = 909303;

}

} idx[200005];

int totalNode = 0;

int mxmxn = 0;

SAM_State *idx_sorted[200005];

SAM_State* SAM_Append(SAM_State *last,SAM_State *root,int ch){

SAM_State *p = last;

SAM_State *np = &idx[++totalNode];

np -> mxn = p -> mxn + 1;

mxmxn = max(mxmxn, np -> mxn);

while (p && p -> to[ch] == NULL) {

p -> to[ch] = np;

p = p -> parent;

}

if (p != NULL) {

SAM_State *q = p -> to[ch];

if (q -> mxn == p -> mxn + 1) {

np -> parent = q;

}else{

SAM_State *nq = &idx[++totalNode];

*nq = *q;

nq -> mxn = p -> mxn + 1;

q -> parent = nq;

np -> parent = nq;

while (p && p -> to[ch] == q) {

p -> to[ch] = nq;

p = p -> parent;

}

}else{

np -> parent = root;

}

last = np;

return last;

}

void init(int n){

for (int i = 0; i <= n ; i++) {

idx[i].init(0);

}

totalNode = 0;

mxmxn = 0;

}

SAM_State* SAM_Build(char* str){

int len = (int)strlen(str);

init(2*len);

SAM_State *root = &idx[0];

SAM_State *last = root;

for (int i = 0; i < len; i++) {

last = SAM_Append(last, root, str[i] - 'a');

}

return root;

}

int cnt[100005];

void toposort(){

memset(cnt, 0, sizeof(cnt));

for (int i = 0; i <= totalNode; i++) {

cnt[idx[i].mxn]++;

}

for (int i = 1; i <= mxmxn; i++) {

cnt[i] += cnt[i-1];

}

for (int i = 0; i <= totalNode; i++) {

idx_sorted[--cnt[idx[i].mxn]] = &idx[i];

}

char a[100005];

int main(){

scanf("%s",a);

SAM_State *sam_root = SAM_Build(a);

toposort();

while (scanf("%s",a) != EOF) {

int len = (int)strlen(a);

SAM_State *sam = sam_root;

int tmp = 0;

for (int i = 0; i < len; i++) {

if (sam -> to[a[i] - 'a'] != NULL) {

tmp++;

sam = sam -> to[a[i] - 'a'];

}else{

while (sam && sam -> to[a[i] - 'a'] == NULL) {

sam = sam -> parent;

}

if (sam == NULL) {

sam = sam_root;

tmp = 0;

}else{

tmp = sam -> mxn + 1;

sam = sam -> to[a[i] - 'a'];

}

sam -> mx = max(sam -> mx, tmp);

}

for (int j = totalNode; j >= 0; j--) {

SAM_State *cur = idx_sorted[j];

cur -> mi = min(cur -> mi, cur -> mx);

if (cur -> parent != NULL) {

cur -> parent -> mx = max(cur -> parent -> mx, cur -> mx);

cur -> parent -> mx = min(cur -> parent -> mxn,cur -> parent -> mx);

}

cur -> mx = 0;

}

int res = 0;

for (int i = 0; i <= totalNode; i++) {

res = max(idx[i].mi, res);

}

printf("%d\n",res);

return 0;

}

FZU 2159 WuYou

February 28, 20152015-02-28hahaschoolLeave a comment

Proceed big numbers A and B,A and B have same digits(Both A and B have no prelude zeros),A contains uncertain digits marking ‘?’.Find a largest A to make A < B.

#include <iostream>
#include <algorithm>
#include <queue>
#include <vector>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <cstring>
#include <ctime>
#include <iomanip>
#include <cmath>
#include <set>
#include <stack>
#include <cmath>

using namespace std;

int main(){
    int caseCnt = 0;
    cin >> caseCnt;
    while (caseCnt--) {
        string a,b;
        cin >> a >> b;
        int bound = (int)a.size();
        bool flag = false;
        bool ok = true;
        for (int i = 0; i < a.size(); i++) {
            if (a[i] != '?') {
                if (a[i] > b[i]) {
                    ok = false;
                    bound = i;
                    break;
                }
                if (a[i] < b[i]) {
                    bound = i;
                    flag = true;
                    break;
                }
            }
        }
        if (!ok) {
            for (int i = bound-1; i >= 0; i--) {
                if (a[i] == '?') {
                    if (b[i] != '0') {
                        a[i] = b[i] - 1;
                        bound = i;
                        ok = true;
                        flag = true;
                        break;
                    }
                }
            }
        }
        if (ok) {
            for (int i = bound-1; i >= 0; i--) {
                if (a[i] == '?') {
                    if (flag) {
                        a[i] = b[i];
                    }else if (b[i] != '0') {
                        a[i] = b[i] - 1;
                        bound = i;
                        flag = true;
                    }
                }
            }
            for (int i = bound+1; i < a.size(); i++) {
                if (a[i] == '?') {
                    a[i] = '9';
                }
            }
            for (int i = 0; i < a.size(); i++) {
                if (!isdigit(a[i])) {
                    ok = false;
                    break;
                }
            }
            if (a[0] == '0' && a.size() > 1) {
                ok = false;
            }
            if (a == b) {
                ok = false;
            }
        }
        if (ok) {
            cout << a << endl;
        }else{
            cout << -1 << endl;
        }
    }
    return 0;
}

#include <iostream>

#include <algorithm>

#include <queue>

#include <vector>

#include <cstdlib>

#include <cstdio>

#include <string>

#include <cstring>

#include <ctime>

#include <iomanip>

#include <cmath>

#include <set>

#include <stack>

#include <cmath>

using namespace std;

int main(){

int caseCnt = 0;

cin >> caseCnt;

while (caseCnt--) {

string a,b;

cin >> a >> b;

int bound = (int)a.size();

bool flag = false;

bool ok = true;

for (int i = 0; i < a.size(); i++) {

if (a[i] != '?') {

if (a[i] > b[i]) {

ok = false;

bound = i;

break;

}

if (a[i] < b[i]) {

bound = i;

flag = true;

break;

}

if (!ok) {

for (int i = bound-1; i >= 0; i--) {

if (a[i] == '?') {

if (b[i] != '0') {

a[i] = b[i] - 1;

bound = i;

ok = true;

flag = true;

break;

}

if (ok) {

for (int i = bound-1; i >= 0; i--) {

if (a[i] == '?') {

if (flag) {

a[i] = b[i];

}else if (b[i] != '0') {

a[i] = b[i] - 1;

bound = i;

flag = true;

}

for (int i = bound+1; i < a.size(); i++) {

if (a[i] == '?') {

a[i] = '9';

}

for (int i = 0; i < a.size(); i++) {

if (!isdigit(a[i])) {

ok = false;

break;

}

if (a[0] == '0' && a.size() > 1) {

ok = false;

}

if (a == b) {

ok = false;

}

if (ok) {

cout << a << endl;

}else{

cout << -1 << endl;

}

return 0;

}

策略是先从前往后扫描一遍已知的数位，如果相等的话，放过当前位，如果当前位a>b这时停止扫描，纪录扫到的位置i，记录状态为1，如果当前位a<b这时停止扫描记录扫描到位置i，状态为2.

对与状态1，如果我们不能在i之前找到一个‘？’使这一位正好比b少1，那么无解，找到了的话，就记录这个新位置为i，跳到状态2。

对于状态2，只要令i左边的数位和B一样，右边的数位都是9就可以了。

都完成之后，做一下最终检查，注意只有一位数时首位可以为0，A!=B就可以了。

CodeForces 126B Password

January 29, 20152015-01-29hahaschoolLeave a comment

#include <iostream>
#include <sstream>
#include <algorithm>
#include <queue>
#include <vector>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <cstring>
#include <ctime>
#include <iomanip>
#include <cmath>
#include <set>
#include <map>
#include <list>
#include <stack>

using namespace std;

#define MAXN 105
int lt[MAXN];

void getNext(char *str){
    int len = strlen(str);
    for (int i=1; i<len; ++i)
    {
        int j=i;
        while (j>0)
        {
            j=lt[j];
            if (str[j]==str[i])
            {
                lt[i+1]=j+1;
                break;
            }
        }
    }
}
//生成kmp next的正确思路是不断迭代，一直迭代到不可能利用到之前next数组的程度（最坏情况迭代到和0比较）这个才是正确的方案

bool KMP(char *a,char *b){
    //match a in b
    getNext(a);
    int lena = strlen(a),lenb = strlen(b);
    int cura = 0,curb = 0;
    while(curb < lenb){
        while (cura < lena && curb < lenb){
            if(b[curb] == a[cura]){
                cura++,curb++;
            }else{
                if(cura == 0) curb++;
                else cura = lt[cura];
            }
        }
        if (curb >= lenb && cura != lena) break;//failed
        if(cura == lena){//success
            return true;
        }
    }
    return false;
}
char toProc[MAXN];
char mid[MAXN];
char last[MAXN];
int main(){
        scanf(" %s",toProc);
        int len = strlen(toProc);
        for (int i = 1; i < len-1; i++) {
            mid[i-1] = toProc[i];
        }
        memcpy(last, toProc, sizeof(toProc));
        int lastlen = len;
        while (lastlen) {
            last[lastlen] = '�';
            if (KMP(last,mid)) {
                printf("%sn",last);
                break;
            }else{
                lastlen = lt[lastlen];
            }
        }
        if (!lastlen) {
            printf("Just a legendn");
        }
    return 0;
}

#include <iostream>

#include <sstream>

#include <algorithm>

#include <queue>

#include <vector>

#include <cstdlib>

#include <cstdio>

#include <string>

#include <cstring>

#include <ctime>

#include <iomanip>

#include <cmath>

#include <set>

#include <map>

#include <list>

#include <stack>

using namespace std;

#define MAXN 105

int lt[MAXN];

void getNext(char *str){

int len = strlen(str);

for (int i=1; i<len; ++i)

{

int j=i;

while (j>0)

{

j=lt[j];

if (str[j]==str[i])

{

lt[i+1]=j+1;

break;

}

//生成kmp next的正确思路是不断迭代，一直迭代到不可能利用到之前next数组的程度（最坏情况迭代到和0比较）这个才是正确的方案

bool KMP(char *a,char *b){

//match a in b

getNext(a);

int lena = strlen(a),lenb = strlen(b);

int cura = 0,curb = 0;

while(curb < lenb){

while (cura < lena && curb < lenb){

if(b[curb] == a[cura]){

cura++,curb++;

}else{

if(cura == 0) curb++;

else cura = lt[cura];

}

if (curb >= lenb && cura != lena) break;//failed

if(cura == lena){//success

return true;

}

return false;

}

char toProc[MAXN];

char mid[MAXN];

char last[MAXN];

int main(){

scanf(" %s",toProc);

int len = strlen(toProc);

for (int i = 1; i < len-1; i++) {

mid[i-1] = toProc[i];

}

memcpy(last, toProc, sizeof(toProc));

int lastlen = len;

while (lastlen) {

last[lastlen] = '';

if (KMP(last,mid)) {

printf("%sn",last);

break;

}else{

lastlen = lt[lastlen];

}

if (!lastlen) {

printf("Just a legendn");

}

return 0;

}

整个比赛都在搞这个题，还不知道哪里不对。

其实这个题如果用kmp做主要卡在这么几个地方：
首先要读懂题，aaaaaa的对应答案是aaaa，四个a，也就是说prefix是在不包括最后一个字符的范围内检索，suffix是在不包括第一个字符的区域检索，中间那个则是在既不包括第一个字符也不包括最后一个字符的范围内检索。
然后Next数组要机智地用好，就是说当前模版串失配之后，机智的方法是利用当前模版串的next数组，直接构造出下一个可能的模版串，而不是一次只删掉末尾的一个字符，再重新扫描这种暴力方法。

其实这个题上面两点我都没想到，更要命的是我的next数组构造方式就存在问题。

在这里重申一下正确的next数组构造方式，首先next[0] = 0,next[1] = 0(next[0]=-1也是可以的)，这个没什么好说的，然后要注意，在进行到中间的时候，首先检查next[当前位]对应的字符是不是和现在的字符相等，相等就在当前next的基础上＋1，赋值给下一位的next，如果没有匹配上这个时候不是简单的归零，而是要把当前的比较位置更新成当前比较位置对应的next值的对应位置，也就是一定要迭代回去。（我就是因为没有迭代，next数组整个就是错误的）

UVa 11488 Hyper Prefix Sets

January 22, 20152015-01-22hahaschoolLeave a comment

#include <iostream>
#include <algorithm>
#include <queue>
#include <vector>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <cstring>
#include <ctime>
#include <iomanip>
#include <cmath>
#include <set>
#include <map>
#include <list>
#include <stack>

using namespace std;

#define MAXN 500000

struct trieNode{
    int next[2];
    int count;
    int dep;
} trie[MAXN];
int boundary = 1;

int main(){
    int casecnt;
    cin >> casecnt;
    while (casecnt--) {
        int n;
        boundary = 1;
        memset(trie, 0, sizeof(trie));
        cin >> n;
        for (int i = 1; i <= n; i++) {
            string toProc;
            cin >> toProc;
            int cur = 0;
            for (int i = 0; i < toProc.size(); i++) {
                if (trie[cur].next[toProc[i]-'0'] == 0) {
                    //create node;
                    trie[cur].next[toProc[i]-'0'] = boundary++;
                }
                cur = trie[cur].next[toProc[i]-'0'];
                trie[cur].count++;
                trie[cur].dep = i + 1;
            }
        }
        int res = 0;
        for (int i = 1; i < boundary; i++) {
            res = max(trie[i].dep*trie[i].count,res);
        }
        cout << res << endl;
    }


    return 0;
}

#include <iostream>

#include <algorithm>

#include <queue>

#include <vector>

#include <cstdlib>

#include <cstdio>

#include <string>

#include <cstring>

#include <ctime>

#include <iomanip>

#include <cmath>

#include <set>

#include <map>

#include <list>

#include <stack>

using namespace std;

#define MAXN 500000

struct trieNode{

int next[2];

int count;

int dep;

} trie[MAXN];

int boundary = 1;

int main(){

int casecnt;

cin >> casecnt;

while (casecnt--) {

int n;

boundary = 1;

memset(trie, 0, sizeof(trie));

cin >> n;

for (int i = 1; i <= n; i++) {

string toProc;

cin >> toProc;

int cur = 0;

for (int i = 0; i < toProc.size(); i++) {

if (trie[cur].next[toProc[i]-'0'] == 0) {

//create node;

trie[cur].next[toProc[i]-'0'] = boundary++;

}

cur = trie[cur].next[toProc[i]-'0'];

trie[cur].count++;

trie[cur].dep = i + 1;

}

int res = 0;

for (int i = 1; i < boundary; i++) {

res = max(trie[i].dep*trie[i].count,res);

}

cout << res << endl;

}

return 0;

}

Trie树，静态方式的话（用数组保存节点），可以比较简单的实现遍历，动态方式（new＋指针）还要写搜索。。。

POJ 2503 Babelfish

January 20, 20152015-01-20hahaschoolLeave a comment

#include <iostream>
#include <algorithm>
#include <queue>
#include <vector>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <cstring>
#include <ctime>
#include <iomanip>
#include <cmath>
#include <set>
#include <map>
#include <stack>

using namespace std;

map<string,string> dict;

int main(){
    ios_base::sync_with_stdio(false);
    string toProc;
    while (getline(cin,toProc) && toProc.size()) {
        string eng,dia;
        int i = 0;
        for (; i < toProc.size(); i++) {
            if (toProc[i] == ' ') {
                i++;
                break;
            }
            eng += toProc[i];
        }
        for (; i < toProc.size(); i++) {
            dia += toProc[i];
        }
        dict[dia] = eng;
    }
    while (cin >> toProc) {
        string toOut = dict[toProc];
        if (toOut.size()) {
            cout << toOut << endl;
        }else{
            cout << "eh" << endl;
        }

    }
    return 0;
}

#include <iostream>

#include <algorithm>

#include <queue>

#include <vector>

#include <cstdlib>

#include <cstdio>

#include <string>

#include <cstring>

#include <ctime>

#include <iomanip>

#include <cmath>

#include <set>

#include <map>

#include <stack>

using namespace std;

map<string,string> dict;

int main(){

ios_base::sync_with_stdio(false);

string toProc;

while (getline(cin,toProc) && toProc.size()) {

string eng,dia;

int i = 0;

for (; i < toProc.size(); i++) {

if (toProc[i] == ' ') {

i++;

break;

}

eng += toProc[i];

}

for (; i < toProc.size(); i++) {

dia += toProc[i];

}

dict[dia] = eng;

}

while (cin >> toProc) {

string toOut = dict[toProc];

if (toOut.size()) {

cout << toOut << endl;

}else{

cout << "eh" << endl;

}

return 0;

}

这个是拿map水过去的版本，其实应该自己手写一个的。。。

HDU 1062 Text Reverse

January 16, 20152015-01-16hahaschoolLeave a comment

#include <iostream>
#include <algorithm>
#include <queue>
#include <vector>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <cstring>
#include <ctime>
#include <iomanip>
#include <cmath>
#include <set>

using namespace std;




int main(int argc, char *argv[]) {
	int cnt;
	cin >> cnt;
	getchar();
	while (cnt--) {
		string str;
		getline(cin,str);
		str += ' ';
		string res;
		int startpos = 0,endpos = 0,status = 0;;
		for (int i = 0;i < str.size();i++) {
			if(str[i] == ' ' && status == 0){
				res += ' ';
			}
			else if (status == 0) {
				startpos = i;
				status++;
			}else if(status == 1 && str[i] == ' '){
				endpos = i-1;
				status--;
				for (int j = endpos;j >= startpos;j--) {
					res += str[j];
				}
				res += ' ';
			}else{

			}

		}
		res.erase(res.end()-1,res.end());
		cout << res << endl;
	}
	return 0;
}

#include <iostream>

#include <algorithm>

#include <queue>

#include <vector>

#include <cstdlib>

#include <cstdio>

#include <string>

#include <cstring>

#include <ctime>

#include <iomanip>

#include <cmath>

#include <set>

using namespace std;

int main(int argc, char *argv[]) {

int cnt;

cin >> cnt;

getchar();

while (cnt--) {

string str;

getline(cin,str);

str += ' ';

string res;

int startpos = 0,endpos = 0,status = 0;;

for (int i = 0;i < str.size();i++) {

if(str[i] == ' ' && status == 0){

res += ' ';

}

else if (status == 0) {

startpos = i;

status++;

}else if(status == 1 && str[i] == ' '){

endpos = i-1;

status--;

for (int j = endpos;j >= startpos;j--) {

res += str[j];

}

res += ' ';

}else{

}

res.erase(res.end()-1,res.end());

cout << res << endl;

}

return 0;

}

请替我问候出题人全家。。。

这个题绝对是良／心／题；为啥你会黄呢？给你个样例吧：
—-watashi-wa-saiko–desu!—-
—-ihsataw-aw-okias–!used—-

上面的－都是空格嗯。。。