当前位置: 开发笔记 > 编程语言 > 正文

关于矩阵快速幂的若干优化

作者：手机用户2502941585_336 | 来源：互联网 | 2023-07-11 11:12

首先，我们复习一下矩阵乘法。我们记3个矩阵A（a行b列）,B（b行c列）,C（a行c列）。我们要计算A*B，并把答案存到矩阵C中。C[i][j]+A[i][k]*B[k][j]（1<

首先，我们复习一下矩阵乘法。

我们记3个矩阵A（a行b列）,B（b行c列）,C（a行c列）。我们要计算A*B，并把答案存到矩阵C中。

C[i][j]+=A[i][k]*B[k][j]（1<=i<=a，1<=j<=c，1<=k<=b），即新矩阵的第i行第j个元素是原1矩阵的第i行*原2矩阵的第j列得来的。

一般来说，我们的计算方法是for(int i=1;i<=a;i++)for(int j=1;j<=c;j++)for(int k=1;k<=b;k++)C[i][j]+=A[i][k]*B[k][j];

其次，让我们复习一下快速幂。

举个例子吧，计算a^101。

我们知道，于是：

a^101=a^(1*2^6)*a^(1*2^5)*a^(0*2^4)*a^(1*2^3)*a^(1*2^2)*a^(0*2^1)*a^(1*2^0)。

我们把101转成2进制：1101101。每个2^x前的系数就是二进制第x位的数。

a^ (2^x)=a^(2^(x-1))^2。我们可以通过a^(2^(x-1))来求得a^(2^x)。

这样，对于二进制下的第x位，该位如果为1，就把ans*=a（更新答案，初始化为1）。然后每次a*=a（用a^(2^x)更新出a^(2^(x+1))，准备处理下一位）。

我们便可以在O(logp)(p为指数)的时间复杂度内出解。

最后，让我们来复习一下矩阵快速幂。

我们要求A^B^B^B^B^B^B^B......（A，B为矩阵），即A^(B^p)的值。

就像ans初值=1一样，记一个单位矩阵（主对角线为1）Ans，结合上面两种做法，我们就可以求出A^(B^p)的值。

(1)对于稀疏矩阵的优化

稀疏矩阵，即为矩阵中有很多元素为0。

优化方法：改变循环顺序。改为for(int i=1;i<=a;i++)for(int k=1;k<=b;k++)for(int j=1;j<=c;j++)C[i][j]+=A[i][k]*B[k][j];

这样有什么好处呢？

我们可以发现，只要A[i][k]==0，那么对答案矩阵（C）不会有任何贡献。

所以我们可以进行优化，在第二个循环到第三个循环直接加一个if，若A[i][k]!=0，才进入第三个循环。

for(int i=1;i<=a;i++)for(int k=1;k<=b;k++)if(A[i][k])for(int j=1;j<=c;j++)C[i][j]+=A[i][k]*B[k][j];

题目：POJ 3735 Training little cats。

(2)预处理优化矩阵快速幂

主要针对多组数据。求A*B^k。给出A，B，T个询问k

在通常情况下，A是一个n行1列的矩阵，B是一个n行n列的矩阵。这样，我们的矩阵快速幂（求A^(B^k)）的复杂度就是O((n^3logk+Tn^2logk))。

具体来说，我们先用O(n^3log(maxk))预处理出B^(2^p)，再A*B^k=A*B^(2^a1)+A*B^(2^a2)+...算答案。复杂度O(Tn^2logk)

(3)优化快速幂过程

主要针对多组数据。

正常的快速幂的当次复杂度为O(log2(n))。看到那个2了吗，我们的工作就是要把这个2变大。

考虑一般的快速幂，一般的快速幂是以2进制为基础的，我们考虑用3进制为基础会怎么样。

对于每一个3进制位，如果该位是0，ans*=x^0，如果该位是1，ans*=x^1，如果该位是2，ans*=x^2

与2进制快速幂同理，每次x=x^3，p=p/3

所以复杂度是O(klogk(n))，k为进制

但是虽然这个2变大了，复杂度却一点也没变小

但是这并不能阻挡我们优化的决心，如果每次询问的底数都相同，我们是能优化的

预处理mi[a][b]=(x^(k^a))^b即可，每次ans*=mi[a][b]，a是当前做到第几位，b是当前这位的数

mi[a][1]=mi[a-1][k-1]*mi[a-1][1]

mi[a][b]=mi[a][b-1]*mi[a][1]

这样复杂度变为(klogk(n)+logk(n))。

(4)常数优化

ikj循环，循环展开 for(int i = 1; i <= n; i++) for(int k = 1; k <= n; k++) for(int j = 1; j <= n; j++) c[i][j] += a[i][k] * b[k][j];

这样能保证b数组的内存访问是连续的

拥有上面全部优化的模板题：https://www.luogu.org/problemnew/show/P5107

#include 
#include 
#define mod 998244353
#define T 256
#include 

struct xxx{
    int a[52][52];
};
struct xx{
    int a[52];
};
struct QQ{
    int x, id;
}q[50100];
int n, d[55];
xxx mi[4][T + 1];
xx ans;
long long Ans[50100];

bool cmp(QQ a, QQ b) {return a.x < b.x;}
 
xxx operator * (xxx a, xxx b)
{
    xxx c; memset(c.a, 0, sizeof(c.a));
    for(int i = 1; i <= n; i++)
        for(int k = 1; k <= n; k++)
            if(a.a[i][k])
            for(int j = 1; j <= n; j++)
                c.a[i][j] = (c.a[i][j] + 1ll * a.a[i][k] * b.a[k][j]) % mod;
    return c;
}

xx operator * (xx a, xxx b) 
{
    xx c; memset(c.a, 0, sizeof(c.a));
    for(int j = 1; j <= n; j++)
        for(int i = 1; i <= n; i++)
            c.a[j] = (c.a[j] + 1ll * a.a[i] * b.a[i][j]) % mod;
    return c;
}

int qpow(int x, int p)
{
    int ans = 1;
    while(p)
    {
        if(p & 1) ans = 1ll * ans * x % mod;
        x = 1ll * x * x % mod; p >>= 1;
    }
    return ans;
}

xx operator ^ (xx a, int p)
{
    int j = 0;
    while(p)
    {
        ans = ans * mi[j][p & 255];
        j++; p >>= 8;
    }
    return ans;
}

int main()
{
    int m, Q; scanf("%d%d%d", &n, &m, &Q);
    for(int i = 1; i <= n; i++) scanf("%d", &ans.a[i]), mi[0][1].a[i][i] = 1, d[i] = 1;
    for(int i = 1; i <= m; i++)
    {
        int u, v; scanf("%d%d", &u, &v);
        mi[0][1].a[u][v]++; d[u]++;
    }
    for(int i = 1; i <= n; i++)
        for(int j = 1; j <= n; j++)
            mi[0][1].a[i][j] = 1ll * mi[0][1].a[i][j] * qpow(d[i], mod - 2) % mod;
    for(int i = 0; i <= 3; i++)
    {
        for(int j = 0; j )
        {
            if(i == 0 && j == 1) continue;
            if(j == 0) for(int k = 1; k <= n; k++) mi[i][j].a[k][k] = 1;
            else if(j == 1) mi[i][j] = mi[i - 1][T - 1] * mi[i - 1][1];
            else mi[i][j] = mi[i][j - 1] * mi[i][1];
        }
    }
    for(int i = 1; i <= Q; i++)
    {
        scanf("%d", &q[i].x);
        q[i].id = i;
    }
    std::sort(q + 1, q + Q + 1, cmp);
    for(int i = 1; i <= Q; i++)
    {
        ans = ans ^ (q[i].x - q[i - 1].x);
        for(int j = 1; j <= n; j++) Ans[q[i].id] = Ans[q[i].id] ^ ans.a[j];
        Ans[q[i].id] %= mod;
    }
    for(int i = 1; i <= Q; i++) printf("%lld\n", Ans[i]);
}

推荐阅读

const
差分约束系统求解House Man跳跃问题的思路与方法

本文讨论了使用差分约束系统求解House Man跳跃问题的思路与方法。给定一组不同高度，要求从最低点跳跃到最高点，每次跳跃的距离不超过D，并且不能改变给定的顺序。通过建立差分约束系统，将问题转化为图的建立和查询距离的问题。文章详细介绍了建立约束条件的方法，并使用SPFA算法判环并输出结果。同时还讨论了建边方向和跳跃顺序的关系。 ... [详细]

蜡笔小新 2023-12-14 11:49:51
const
Open judge C16H: Magical Balls 快速幂+逆元问题解析

本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法，并给出了问题的解析和解决方法。详细介绍了问题的背景和规则，并给出了相应的算法解析和实现步骤。通过本文的解析，读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]

蜡笔小新 2023-12-14 12:03:27
const
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
const
P1651 塔 (动态规划) 的最大高度计算方法

本文介绍了P1651题目的描述和要求，以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术，将问题转化为求解差值的问题，并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]

蜡笔小新 2023-12-13 19:52:19
go
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
const
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
string
HDU 2372 El Dorado（DP）的最长上升子序列长度求解方法

本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法，通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]

蜡笔小新 2023-12-14 15:08:18
include
九度OnlineJudge之1002：Grading问题的解决方法

本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程，将每个考题分配给3个独立的专家，如果他们的评分不一致，则需要请一位裁判做出最终决定。文章详细描述了评分规则，并给出了解决该问题的程序。 ... [详细]

蜡笔小新 2023-12-14 13:00:09
char
c语言\n不换行,c语言printf不换行

$c语言\n不换行,c语言printf不换行$

本文目录一览：1、C语言不换行输入2、c语言的 ... [详细]

蜡笔小新 2023-12-14 11:05:35
char
油田地块的划分和计数方法

本文介绍了一种划分和计数油田地块的方法。根据给定的条件，通过遍历和DFS算法，将符合条件的地块标记为不符合条件的地块，并进行计数。同时，还介绍了如何判断点是否在给定范围内的方法。 ... [详细]

蜡笔小新 2023-12-14 09:18:20
char
二叉树层序创建问题的解决方法

本文介绍了解决二叉树层序创建问题的方法。通过使用队列结构体和二叉树结构体，实现了入队和出队操作，并提供了判断队列是否为空的函数。详细介绍了解决该问题的步骤和流程。 ... [详细]

蜡笔小新 2023-12-13 18:20:50
const
UVALive6575 Odd and Even Zeroes 数位dp+找规律

本文介绍了UVALive6575题目Odd and Even Zeroes的解法，使用了数位dp和找规律的方法。阶乘的定义和性质被介绍，并给出了一些例子。其中，部分阶乘的尾零个数为奇数，部分为偶数。 ... [详细]

蜡笔小新 2023-12-13 14:19:28
char
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
go
C++中的三角函数计算及其应用

本文介绍了C++中的三角函数的计算方法和应用，包括计算余弦、正弦、正切值以及反三角函数求对应的弧度制角度的示例代码。代码中使用了C++的数学库和命名空间，通过赋值和输出语句实现了三角函数的计算和结果显示。通过学习本文，读者可以了解到C++中三角函数的基本用法和应用场景。 ... [详细]

蜡笔小新 2023-12-13 10:06:01
const
[CF949D]Curfew 二分答案是个不错的开头，困难部分在于如何检查

本文介绍了一个题目的解法，通过二分答案来解决问题，但困难在于如何进行检查。文章提供了一种逃逸方式，通过移动最慢的宿管来锁门时跑到更居中的位置，从而使所有合格的寝室都居中。文章还提到可以分开判断两边的情况，并使用前缀和的方式来求出在任意时刻能够到达宿管即将锁门的寝室的人数。最后，文章提到可以改成O(n)的直接枚举来解决问题。 ... [详细]

蜡笔小新 2023-12-13 09:08:55

手机用户2502941585_336

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章