本地存储加线上获取：我的个人数据库建构路径@annote

<aside> 📝 2024年12月02日 16:51:08

使用过笔记类软件的朋友都知道，这位朋友遇到的可能是一个共性问题，也就是：我们自己的笔记究竟该如何处理才最方便、最有助于个人成长？不同的软件有不同的理念，有的服务注重开放性，能够与市面上的其他服务共通，便于定制自己的知识空间；有的软件则认为自己的知识整理理念独一无二且非常优秀，因此相对封闭，便于吸引用户且留住用户。

</aside>

<aside> 📝 2024年12月02日 16:51:21

针对笔记和知识整理领域，我们来共同探讨关于个人数据整理的问题：

究竟什么样的个人数据存储方案才是好的？
如何构建适合自己的数据存储空间？
构建自己的个性化服务应该注意哪些内容？ </aside>

<aside> 📝 2024年12月02日 16:51:51

什么样的存储方式才是「好」的？

现在是 21 世纪，因为疫情，云服务在这两年大热。在这两年，不少云存储服务也百花齐放。但说到存储，**首先要搞清楚我们要存储些什么东西？**既然是要存，我们希望的自然是能够「在我想要的时候找到它」，减少损坏、降低遗失的几率。各家云服务为我们提供了随时获取自己数据的权利，但也带来一个问题，那就是：我们存到云端的数据，还是我们的吗？随着不少云服务供应商的政策变化，我们越来越注意到，放在云端，虽然方便获取，但也方便丢失了。靠谱的供应商还给你数据导出和备份的机会，不靠谱的，直接关掉你的账户，你的数据、记忆、情感、心血，可能一瞬间就灰飞烟灭。所以，这两年回归本地仓储的声音也越来越高。因为，放到云里，实在太不稳定了。

那么，多备份几份数据不就好了？

是这样，一个服务商丢了，我们可以从另一家获取。我的还是我的。这就是 All-in-all 的存储，安全、稳定、便利。但我们当真需要花费这么多时间和精力对自己的数据进行整理、归档、存储吗？要知道，每多存储一份，需要付出的时间、金钱也多一份。

</aside>

<aside> ⭐ 2024年12月02日 16:52:20

世界上还存在另一种服务，All-in-one 的服务，如果不能选择把数据交给所有服务商，那就交给一家放心的好了。如果说 All-in-all 的存储是一个极端，那 All-in-one 这种服务，则走向了另一个极端。前者过于耗费心思，后者则直接放弃了自己选择的权利，前者是「把每一个鸡蛋各自放在一个篮子里」，后者是「把所有鸡蛋都放到同一个篮子里」。任何一个明智的人都知道，凡事有度，走向任何一个极端都不合适。

</aside>

<aside> 〰️ 2024年12月02日 16:52:45

有人讲，我交给自己放心的服务商，良好的互联网生态下，使用起来更为便利。虽然放弃了自己选择的权利，但我获得了优质的服务，何乐而不为？

当然是的，但这种情况的前提是：我们一辈子都呆在同一条船上，不导出自己的数据。就用它好了，不需要导出，这样在任何设备，登录一个账户，就能看到自己的信息了！

看似美好，但这样做的话，我们也陷入的一定的风险，比如「某笔记」的怪圈：

VIP VVIP VVVIP 不断地拿钱「续命」；
无法体验到新工具的优势，这都跟你无关，只能用它；
用得越多，沉没成本越高，越难以脱离这个工具，迁移所需要的成本也越高。

这就是所谓的数据孤岛。用得越多，沉没成本越高，越难以脱离这个工具，迁移所需要的成本也越高。

</aside>

<aside> ⭐ 2024年12月02日 16:52:57

为避免这种情况的发生，我诚挚地推荐大家构建自己的个人数据库。而且，当我们构建个人数据库时，需要仔细斟酌各项服务的优劣。依照我的个人经验，要想「避坑」，需要遵循两条原则：

尽量不要选择纯线上服务；
即便使用线上服务，也要选择「支持开放的 API 导出」的服务，而非手动导出； </aside>

<aside> ⭐ 2024年12月02日 16:53:18

当你需要查询某个内容，你的做法并不是通过搜索引擎，而是在你的「个人数据库」中，通过模糊查询，就能找到你需要的这些内容。

不仅如此，这条信息的属性（标签），以及当初加入时你写的备注，甚至于这条信息的关键内容（标注），以及出处（原文链接）等有效信息都能被迅速找到。

而这条信息要比从搜索引擎得到的内容更加专门针对于你，这就是个人数据库，一个属于你自己的信息筛选 / 查询 / 编辑整理系统。

能做到上面这点工具有很多：

主打第二大脑的印象笔记，One Note，以及现在流行的 All-in-one 的 Notion 等。
现在流行的双链笔记工具：Obsidian / Logseq 等。
各种稍后读 / 书签服务：Pocket / Instapaper / Raindrop 等。 </aside>

<aside> 📝 2024年12月02日 16:53:44

一个良好的个人数据库

</aside>

<aside> 📝 2024年12月02日 16:53:51

1. 多元的信息标识

首先，数据信息是数据库构建的基础，对数据加以整理形成数据库的基础在于信息标识。 **所谓信息标识，是指对信息的描述、解释和控制，一般而言，基础的信息标识包括数据的标签、备注、描述等等。**多元且丰富的信息标识使得我们对信息的检索和获取更加便利，因此，信息标识越多越好，或者讲，可添加的信息属性 / 维度越多越好。

</aside>

<aside> 📝 2024年12月02日 16:54:03

2. 本地化数据管理

其次，既然是「个人」数据库，就要注重数据信息的「专属性」和「隐私性」。「专属性」自不必言，当我们选择信息时必然围绕着自己的相关需求展开；而对于「隐私性」，在处处实名的今天，似乎成了一个笑话，大厂围绕数据安全的论战不断，也充分体现人们对隐私的关注。

我们不追求「隐私换取便利」，但也要尽可能把隐私安全放在重要位置。You are what you read，你阅读的东西造就了你，而如果你的阅读记录被泄露，也足以分析出你是什么样的人。因此，为了追求「隐私安全」，我们应尽量选用以本地管理为主的服务，凭借本地化存储和管理方式，我们可以完全控制数据的存储方式、访问权限以及信息安全协议等

</aside>

<aside> 📝 2024年12月02日 16:54:37

单纯地看，线上服务更方便，但纯线上的服务都无法满足方便迁移这个事情，越是主打快照功能的服务越是如此。这也就发生了上文截图反映的问题：不方便迁移。为什么这样讲？

主要有以下三个原因：

其一，仅仅支持导出到本地是不够的。导出后的数据若无法与线上数据形成对应关系，就无法形成系统的知识体系。若再给导出的数据增加一条「护城河」，仅支持导出专有格式，那这样的导出本地几乎没有意义。这意味着导出的数据对我来说是不方便处理的。如果无法构建「库」，再多的本地数据也是一片散沙。因此，支持本地快照和离线存储是把数据放到自己手上，而导出的格式是什么也同样重要。

其二，**无法实现自动化方案。**我们可以导入一条数据后再手动将其导出至本地，但这样做太费时间了，如果支持自动化，何乐而不为？

其三，**后端流量消耗严重。**设想一个用户有 100MB 数据，如果有 100 个这样的用户呢？

正所谓**「导入一时爽，导出火葬场」**。

</aside>

<aside> 📝 2024年12月02日 16:54:45

3. 公有化数据结构

鉴于不少服务增加这条「护城河」来把用户锁在城里的做法过于无耻，笔者认为，优秀的本地存储应使用公有数据结构 ，以基于文本的格式为例，如 HTML、 JSON、 Text Bundle、 Markdown 等都是良好数据结构。

</aside>

<aside> 📝 2024年12月02日 16:54:49

4. 自由的数据导出

如果同时满足第二点和第三点，即为自由导出。可以离线 + 方便处理 ≈ 数据自有。

</aside>

<aside> 📝 2024年12月02日 16:54:52

5. 方便的数据导入

如果支持 API 的话，可以通过各种线上的自动化平台，便利地从线上导入数据到本地。也就意味着，自己手上永远有一份数据备份。

</aside>

<aside> 💡 2024年12月02日 16:55:08

建议优先选择基于本地系统的双链笔记，如 Obsidian、Logseq 等，它们支持本地系统，并且基于文本格式，因此可以使用任意多的信息标识，方便索引，方便搜索，方便迁移。

它们可以满足个人数据库：

多元的信息标识
本地化数据管理
公有化数据结构
自由的数据导出 </aside>

<aside> ⭐ 2024年12月02日 18:29:59

https://res.cloudinary.com/dvyu4sgrr/image/upload/v1732682511/simpread/4ee844619d41041ba571fd794c94b85125c2f6e5.webp

</aside>

<aside> ⭐ 2024年12月02日 17:14:23

有没有一种线上 + 线下的方案，不仅可以弥补本地仓储「不方便获取」的缺陷，也能弥补在线存储造成的「数据孤岛」？

不如试试简悦吧，它几乎可以完全满足个人数据库的要求。并且，由于高度的可定制化，弥补了线上和线下服务的劣势。

简悦是什么？多数朋友从「阅读模式」或「主打沉浸式阅读体验」了解到的简悦。但简悦已经存在四年多了，为什么要在这个时候再提起它呢？在这几年的版本迭代中，我发现，**读者用户所需要的不仅仅是清爽的阅读体验，还有阅读过程的整理和思考。**我个人比较喜欢阅读，也正是因为厌烦了不规范的页面和无处不在的小广告，才开发了简悦的最初版本。但如果简悦止步于「阅读模式」，我们不必再度提及。在历次版本迭代中，**读者用户的需求各式各样，如何满足绝大多数人的不同口味？**正是这个问题引发了我将简悦转型的许多思考。

也就是说，我希望简悦可以成为大家的知识管理助手，而非单纯一个 Read Mode 插件。

举例而言，在个人数据库的管理上，基于本地系统的 Obsidian、Logseq 等工具，由于其并没有官方提供的剪藏工具（本地化服务的剪藏能力先天不足），无法从手机端便利地导入本地，而第三方的剪藏工具的效果也参差不齐。为了弥补这一点，简悦增加了这几个功能：

导出到 Obsidian
复制 Makdown 到剪切板
Live Editor
Obsidian 与简悦都是本地优先，所以这里有一大票关于它们的联动方案。 </aside>

<aside> ⭐ 2024年12月02日 17:14:29

你可以依靠开放的互联网生态借助简悦打造自己的个人数据库，因为：

简悦是基于本地系统的服务，主张隐私至上，此外依靠同步助手，你的本地管理更为方便。
简悦本身就是阅读模式 + 标注 + 稍后读的服务。
简悦可导出到市面上几乎任意生产力工具。
简悦也支持多元的信息标识，可无限嵌套标签，增加备注，串接外链，思维导图以及双向链接，更近似于双链笔记形态。
简悦是一个开放性的系统，支持 API 导入以及导出，而且全部可以配置为自动化方案。 </aside>