我想跟踪任何类型文件的修改,我正在使用Javascript和SHA256加密哈希函数。
问题是对于某些类型的文件,即使没有……
通常,如果任何单个字节具有不同的值,加密散列将产生不同的散列,无论该字节与该字节有多无关。这就是哈希的重点。
根据您的具体要求,它可能会或可能不会足够接近。
如果你的要求是“这个内容看起来是否足以被认为是相同的”,并且对合法性的要求非常宽松,那么你可以尝试为所有输入生成一个稍微稳定的文本表示并改为哈希(例如提取你的纯文本) doc文件并丢弃所有格式和元数据)。
如果你需要任何比这更微妙的东西(例如“这个文件有没有 用户可见 然后,很难准确定义哪些部分需要进行散列,哪些部分不应该是,这意味着你 的 将 强> 弄错了哪个可能很糟糕(或者错误对你的要求不是很大?)