Author: oopus

  • Dropbox 的 Smart Sync 触发自动故障导致磁盘空间被迅速消耗完的问题

    Dropbox 的 Smart Sync 触发自动故障导致磁盘空间被迅速消耗完的问题

    Dropbox 的 Smart Sync 功能允许用户将文件设为”仅在线”以节省本地磁盘空间。然而,Dropbox 客户端在重新启动时(例如系统从睡眠唤醒、客户端更新或手动重启),有时会将大量文件夹的 Smart Sync
    策略从”仅在线”批量重置为”下载到本地”,触发数万个文件的大量下载,迅速耗尽磁盘空间。这一行为并非用户误操作,而是 Dropbox 客户端的已知问题。

    当这种情况发生时,在 Dropbox 正在执行批量下载的过程中,直接通过右键菜单将文件夹设为”Make available online only”往往无效,因为父级文件夹的策略优先级更高,且 Dropbox 的下载队列在重启后仍会持续执行。

    有效的解决方法是:完全退出 Dropbox 客户端,然后用 SQLite 工具打开本地数据库文件 smarter_smart_sync.dbx(位于 AppData\Local\Dropbox\instance1\),执行 UPDATE scan_history SET folder_policy=NULL WHERE folder_policy=1
    将所有被重置的下载策略清除。操作前建议先备份该文件。清除后重新启动 Dropbox,立刻暂停同步,再对 Dropbox 根目录执行一次”Make available online only”,然后恢复同步,Dropbox 便会开始删除本地副本、释放磁盘空间,而不再重新下载。

    为避免此问题,建议对于不需要本地存储的超大文件夹改用 Selective Sync(选择性同步)而非 Smart Sync,因为 Selective Sync 将文件夹完全排除在本地之外,不受策略重置的影响,稳定性更好。此外,也建议在磁盘上保留足够的余量,以便在策略意外重置时有足够时间发现并处理。

  • 圣诞假补完链锯人蕾塞篇

    圣诞假补完链锯人蕾塞篇

    前段,男频 yy 恋爱剧嘛,有什么好看的。中段,哇,分镜!音乐!节奏!适合圣诞的打斗爆米花番! 过度到结尾之前:有些事既正确又恶心,那么就愉快地不要恶心自己!结尾:价值观冲突时,「子弹的批判」总是适合悲剧。权力/暴力决定结局,也算是当下文化的写实。豆瓣 9.1, 真不错。
    原作藤本树:「原作中让帕瓦最后登场是为了过渡到下一章,但拍成电影我也想过,结束时是否有必要让她出场。不过多亏她最后阳光的声音,能让自己心情愉悦地走出电影院。」你也知道吖!

  • VSCode 中文折行不完全

    在 VSCode 中安裝了主題和字體之後,開啟折行時,有時會出現折行後仍然有一部分內容需要透過水平滾動條顯示的狀況。

    這時候可以進入 VSCode 的設置,檢索”Wrapping Strategy”, 把它設置為 advanced 即可。

  • Trending stories 轉型方案

    Trending stories 轉型方案

    Trending stories 網站在設計的時候,有兩個技術點,首先是用打開 internet access 的 gemini api 根據 Google trends 生成新聞。這本身也是我自己想要的產品,經常看到 Google trends 一頭霧水,希望能快速知道這些搜索熱詞背後到底是什麼,而不是被新聞站或者 twitter 這種基於推送的算法引導。第二個是用 flux .1 模型為每一條新聞配圖。如:

    https://trending.oopus.info/date/20251101

    在推廣失利以及和 LLM 深度探討之後,對 Trending news 有進一步的思考:新聞站有大量競品,甚至是惡意新聞農場。而關於新聞報道,Google 本身也在做 news 和其他產品來解釋新聞。基於 Google trends 做新聞解釋網站等於與自己的完整產業鏈供貨者競爭下游利益,更難成功。

    考慮到當前網站的維護由於圖片生成質量不穩定,需要我自己檢查和重新生成部分圖片,所以沒辦法全自動運行。那麼當前的轉變是:

    1. 把基於 AI 的圖片生成轉為簡單的詞雲。如 https://trending.oopus.info/date/20251104 頁面的後二十張圖。這樣雖然更加不好看,但更容易讓人一眼就能看到今天的新聞熱點,以及當前所瀏覽新聞的大致熱度。比如 20251104 的熱點是選舉。
    2. 生成 trending news 的文本需要一個模板(還沒做,這幾天調試 prompt)。比如每一篇新聞都由總結,為什麼會變成今日熱點,以及何時、何地、何人、何事。
    3. 把新聞生成程序部署到雲端,全自動生圖生文,卡住早、晚報的時間(還沒做,這幾天做)。讓偶爾能看到這個網站的人,確實可以看到今日新聞。網站不會因為我某天沒來得及手動做圖片質檢而導致新聞推遲發佈。
    4. 【真正的轉變】基於當前的每日新聞撰寫深度報道和分析文章。這些文章可以用 AI 生圖, AI 組織,AI 分析,但都要經過自己來最終成文。這些深度報道和分析也許可以發佈在另一個新的網站上。它們是作為對 trending news 相關新聞的「透視」。建立 trending news 的目標本來就是希望研究「新聞」和「歷史」的關係。之前想看看 trending news 作為日報,本身是否能成為獨立產品。現在看來不太行,那麼就回到最初設計。並且這也是「須有我在」。之前單純是基於 U.S. Google trends 面向北美的產品,並沒有「我在」。而現在把自己對新聞的興趣,自己設計的相似性算法,自己的新聞分析,以及可視化加進來。

  • Troubleshooting Localhost Access Issues: When Your Terminal Can’t Reach Local Services

    Have you ever encountered a frustrating situation where your browser can access a local service, but your terminal and IDE cannot? Recently, I faced this exact issue while trying to access a ComfyUI API running on 127.0.0.1:8188.

    The Problem

    • What worked: Browser with proxy settings could access the local service
    • What didn’t work: VSCode, terminal, and curl commands couldn’t reach 127.0.0.1:8188
    • What I tried: Cleared system and IDE proxy settings, removed HTTP_PROXY and HTTPS_PROXY environment variables

    Despite confirming that echo %HTTP_PROXY% and echo %HTTPS_PROXY% returned empty values, the issue persisted.

    The Solution: Let Your Tools Tell You What They See

    Sometimes the best approach is to let your applications reveal their own proxy configuration. Here’s a Python script that helped me diagnose the issue:

    import os
    import urllib.request
    
    print("--- Checking Environment Variables from Python's perspective ---")
    # os.environ is how Python sees all environment variables
    print(f"HTTP_PROXY: {os.environ.get('HTTP_PROXY')}")
    print(f"HTTPS_PROXY: {os.environ.get('HTTPS_PROXY')}")
    
    print("\n--- Checking what proxies urllib automatically detects ---")
    # getproxies() shows what urllib will use by default
    print(urllib.request.getproxies())

    What This Reveals

    The urllib.request.getproxies() function shows you exactly what proxy settings your Python environment detects, even when environment variables appear clean. This often reveals:

    • Registry-based proxy settings (Windows)
    • System-wide proxy configurations
    • Application-specific proxy settings that override environment variables

    The Fix: Explicitly Disable Proxies

    If you find unwanted proxy settings, you can force urllib (and applications that use it) to bypass proxies entirely:

    # Create a proxy handler with no proxies
    proxy_handler = urllib.request.ProxyHandler({})
    opener = urllib.request.build_opener(proxy_handler)
    urllib.request.install_opener(opener)

    Key Takeaway

    When troubleshooting network connectivity issues, don’t just rely on environment variables and system settings. Use your application’s own introspection capabilities to understand what it actually sees. This approach often reveals hidden proxy configurations that standard troubleshooting methods miss.

    Pro tip: Always check what your specific tools and libraries detect, not just what the system claims to be configured.

  • VSCode Python Run Button Not Working? Check Your Extension Version

    If you’re experiencing issues with VSCode where clicking the “Run” button in the top-right corner of a Python file doesn’t work properly, you might encounter these problems:

    1. No new terminal window is activated (the new windows are created in the background)
    2. The command “python xxx.py” doesn’t execute automatically

    Here’s a quick fix that often resolves this issue:

    Solution:

    Go to your VSCode Extensions panel and locate the Python extension. Check if you’re currently using the pre-release version of the Python extension. If you see “Pre-Release” indicated next to the Python extension, that’s likely the culprit.

    Simply switch from the pre-release version back to the stable release version. You can do this by clicking on the extension and selecting the option to install the release version instead.

    After switching to the release version, restart VSCode and try running your Python file again. The run button should now properly activate a new terminal and execute your Python script as expected.

  • 十個月兩個項目的低谷

    epr (番劇推薦)半年籌備獲得慘淡的點擊率之後,奮起兩個月,把 trending 做出來。這個禮拜 trending(熱門關鍵詞解說) 在 hackernews 和 reddit 收穫雙份失敗,這個禮拜就特別的 down 無比的 down. 加上老爸和老媽的矛盾導致老爸被 120 送到醫院,就更覺得世界的荒謬。到週日,實在就動不了。和 gemini 好好聊了一次,收穫許多 pua. 也是令人溫馨治愈, 感覺被 pua 到了(不要代入啊,喂!)!也獲得了實質性可以試驗的建議

  • 世界当今的困境思考

    上一個時代,世界的困境是東西方陣營的對抗。而面對這一困境的普世性訴求是平等和自由。

    上上一個時代,世界的困境是不平等和舊制度。面對這一困境的方式是解放。同樣在東西方,都在對抗和消解前現代的不平等。

    当下時代,各種政治、經濟、社會相關的學說在學術市場,為掙得教職和學術身份,散亂堆疊。在實踐家與獨立的社會擾動性實驗越來越少的當下,我們到底在解決自己的職業問題,還是世界的問題?

    從自己的經歷反思中,想到當下世界的的三件極壓迫個人的問題:

    首先是資本至上的資本主義,它通過資本、慾望、習俗、文化控制者各行各業,控制每一個人的行動和自由。

    第二是政治問題:威權主義。從東方到西方,對社會以及每一個人自由的控制力在當下每一個國家都在瘋漲。

    第三個是社會問題:小集團的信息繭房和層層自利。從每一個國家,每一個地區,到每一種性別,每一種宗教,到每一個階級,每一種職業,到每一個學校,每一個中心,到每一個家族,每一個家庭,到每一個人。理念和利益的衝突帶來的社會各層面的對抗和撕裂。

    競爭和個人利益(家庭、社會、國家利益)在這些的問題中成為每一方自我掙扎的唯一方式,並且催生糟糕的競爭或者是在中國互聯網語境裡的「內捲」。當下的我們似乎還沒有理論,沒有實踐,沒有力量嘗試全面解決這些問題。

  • clash verge + proxifier only proxies part of your traffic issue

    If you find that your Clash Verge + Proxifier setup only proxies part of your traffic, double-check whether the port opened from Clash Verge to Proxifier is set to Mixed Port or another type. If it is not set to Mixed Port, change it to Mixed Port, and it should work.

    This issue can occur with VS Code and GitHub VS Code.

    On the other hand, for VS Code and Docker, if you are using Proxifier, please change your “localhost” proxy rule to Direct instead of Proxy.

  • 开源开放的番剧推荐计划 – 友声 Anime Episode Recommender

    帖子发在 bangumi https://bangumi.tv/group/topic/430934

    这个持续开发了将近半年,由七个 GitHub 开源 repo,加上一个暂时还没放到 GitHub 的 repo 共同支撑的项目终于上线啦~

    最开始开发的是 eplot 这个摘要网站。它是许多想法的 base. Epr (友声 Anime Episode Recommender)便是 eplot 项目的一个扩展。Eplot 的一个大缺陷是,用 LLM 生成摘要一定会有错误。而用它来做内容推荐,能极大规避 LLM 摘要错误的影响。

    接下来,一方面根据 bangumi 的反馈继续开发 epr 项目。另一方面,开始考虑基于 eplot 摘要的其他可能性。


    【网页】

    https://epr.oopus.info/

    【使用方法】

    这是一个基于大语言模型 Gemini 2.5 Flash 的开源开放的番剧推荐计划。它的功能专注于番剧推荐。

    使用方法很简单,在网页界面中: https://epr.oopus.info/ , 您可以选择两部您喜欢的番剧,系统就会把这两部番剧的摘要提交给 Gemini 2.5 Flash 模型,向您推荐两到三部和这两部类似的番剧。

    【起因】

    面向影视、书籍的推荐系统很多。我希望做一个侧重于内容相似性的推荐系统,因为内容包含的信息量相比元数据(监督、原画、风格、时代等等)更丰富。

    番剧本身作为画面、时间、语言、声音等的集合,什么是「内容」,以及如何提取「内容」?这需要好好考量。我自己对语义处理更熟悉,所以把问题简化到字幕组的字幕。使用大语言模型对字幕进行总结,反推出故事的「内容」文本。

    一开始的模型使用 deepseek,后来 gemini 2.5 flash 和 pro 发布,它们的汇总能力以及输出速度当时都更好,并且 gemini api 有免费的额度,于是转向 gemini,一直到现在。

    解决了「内容」的问题之后,一开始想要基于 sentence embedding 做内容相似度为主,用元数据作为辅助的番剧推荐系统。这个思路的问题是,它没有办法推荐我还没收集的番剧。由于制作摘要本身耗费时间,当前的主要收录 2022 年至今 bangumi 收藏量前三的一月,四月,七月,十月番。如果推荐系统总是推那些大家都知道的番,它推荐的价值就很低。

    于是试着把番剧的摘要提交给 gemini, 让它依据自己的知识来推荐。测试的结果相当好。在测试中会推荐一些特别冷门但很有道理、有趣的番。

    另一个问题,包含更多细节的「内容」对推荐有价值,但把番剧过于详细的内容提交给 LLM,边际效用会递减。基于这个前提,包含足够细节的文本量,超过两部可能就太多了(input token 大概 1.5K 字左右,output token 大概 1K 字左右)。所以我把这个项目设置为只能选择两部来做推荐的模式。

    【开源的技术实现】

    这是查询界面:

    https://github.com/sudoghut/ep-rec-interface

    这是查询界面后台数据库(所有番剧摘要的数据都开放在它所 clone 的 eplot-data-compiler 项目里面):

    https://github.com/sudoghut/ep-rec-api

    这是用于制作后台数据库的项目(所有生成的番剧摘要数据都在 data.db 这个 sqlite 数据库中,欢迎下载和二次开发) :

    https://github.com/sudoghut/eplot-data-compiler

    这是把所有摘要展示在网页上的另一个开源项目(您可以直接在这里看到 LLM 生成的摘要,也可以使用网页查询内容):

    网页: https://eplot.oopus.info/
    开源代码: https://github.com/sudoghut/eplot

    这是用来轮询 Gemini token 的后端:

    https://github.com/sudoghut/safe-trigger

    这是排队器:

    https://github.com/sudoghut/queue-single-line

    因为使用免费的 token 资源,所以当前的队列长度是最多能容纳 50 个人的单线程排队。每次生成的等待时间大约是半分钟。排队的人多了可能等待时间比较久,大家可以根据当前所在队列的位置预估排到的时间。
    另外,为了应对上线未知的流量,当前的 token 是从咸鱼买来的 50 个。卖家肯定有一 token 多卖的情况,当前测试的状况是一天至少会有两个 token 被封。【注意:如果大家辛苦排完队提示 token 错误,又从队尾开始排,先向大家抱歉。】建议如果在队列中,就把浏览器 tab 放一边,别故意等它。

    这是用于检查 gemini api 是否被封的小工具:

    https://github.com/sudoghut/token-validator

    【欢迎来自您的协力】

    当前这个项目因为对我自己也很有帮助,所以无论如何会至少一个人长期维护。如果您对共同维护这个项目感兴趣,也欢迎一起来维护。当前想到的贡献方式有三种。

    首先,是 eplot https://github.com/sudoghut/eplot 纠错。字幕只是番剧内容的一个侧面,根据画面和声音,容易理解的剧情,但只有字幕,有时人类也可能猜错剧情,更不要说 LLM 了。在使用 eplot 的时候,如果您看到错误的剧情摘要,欢迎直接提交 pr 或者 issue 修改。一定希望提交修改后的内容,而不只是指出错误。因为指出错误之后, LLM 有时也没办法根据有限的字幕信息改对。不过剧情些许错误对 epr (推荐生成)的影响不大。

    第二,番剧的 ass 字幕,有字幕轨的视频文件,或者直接贡献摘要。当前字幕文件主要从 mikan 和 dmhy 下载。感谢这两个项目!大多数是直接从有中文字幕轨(不是烧录在视频里面)的视频里面提取,一小部分字幕组提供了 ass 字幕下载。如果您感兴趣的番剧还没有被 epr 项目收录,欢迎在本帖下回复资源(番剧的 ass 字幕,有字幕轨的视频文件),或者发送站内信。

    如果您熟悉 github,也欢迎直接往 eplot 项目 https://github.com/sudoghut/eplot/tree/main/src/content/blog 里面提交摘要.

    文件名格式是:英文名_集数.md

    内容的格式是:

    ---
    title: "中文标题 集数"
    description: "短摘要"
    date: yyyy-mm-mm
    tags: ["中文名", "英文名", "开播时间,格式为 yyyymm"]
    ---
    
    长摘要

    您也直接参考已有的例子来写 md 文件:

    https://raw.githubusercontent.com/sudoghut/eplot/refs/heads/main/src/content/blog/Apocalypse%20Hotel_01.md

    第三,免费的 gemini token. 如果您有闲置的免费 tier (一定确认不要分享付费的 tiers)的 gemini token, 并且愿意分享,也欢迎通过站内信分享。在 safe-trigger 程序里面,设置的使用频率是不快于每分钟使用一次(当前准备了 50 个 tokens 用于轮询, 每个 token 最快也是二十五分钟使用一次。您也可以明确告诉我,希望轮询您的 token 最短的时间),每次 request 使用的 input token 数量大概是 1500,输出字数大概是 1000. 确认这样的使用下不会影响到您自己 quota 的前提下,欢迎分享。您的 token 将会只用于 epr 的番剧推荐。