ぽっぺんしゃんにょろりんこ

匿名・非追跡型アダルト動画検索エンジンの設計ノート

2025-05-01から1ヶ月間の記事一覧

「ITで日本の医療を変える!」という会社に入ったら、SESの人売り営業だったというお話。「SESの闇回」

こんにちは、にょろりんこです。 今日は少し自分語り寄りの回になりますが、「SES企業に入ったら闇しかなかった話」を書こうと思います。 「未経験歓迎・社会貢献・成長できる環境」──そんなキラキラ言葉の裏に潜む、SESのリアルな現場を営業として体験した…

アクセス不能になったURLをDBから削除する。DBクレンジングという裏方作業のお話

こんにちは、にょろりんこの備忘録的技術ブログです。 今回はNode.jsを使い、アクセス不能になったURLをDBから削除する(DBクレンジング)という話です。 SaePornsのような動画検索サービスでは、日々大量のURLが自動で収集・登録されていきます。けれど、そ…

Node.js + Puppeteerでサムネイル画像を動画ページから抽出するという話

こんにちは、にょろりんこの備忘録的技術ブログです。 今回は、動画ページから最適なサムネイル画像URLを抽出するためのモジュール、fetch-image.js をご紹介します。 これは、私が開発・運用しているポルノ動画検索エンジン「Sae-Porns」の中でも、ユーザー…

Node.js + Puppeteer で動画タイトルをなるべく正確に取得する方法

こんにちは、にょろりんこの備忘録ブログです。 今日は Sae-Porns の中でも地味だけど重要な処理──動画ページのタイトルをなるべく正確に取得する仕組みについて解説します。 今回取り上げるのは、以下のモジュールです: async function fetchTitle(page) {…

エンジニアと非エンジニアの仲が悪い組織はなぜ生まれるか?私がコードを書き始めた理由。

こんにちは、にょろりんこの備忘録ブログです。 今日は自分語りでエンジニアと非エンジニアの仲が悪い組織はなぜ生まれるか?という話です。 私はかつて、あるWeb制作会社で営業職として働いていました。クライアントの課題を整理し、プロジェクトを設計し、…

Node.js + Puppeteerで不要リソースをブロックし、軽量&安全にページを取得するという話

こんにちは、にょろりんこ的、備忘録技術ブログです。 以前に「インデックスする必要のないページは最初から開かない」という話をしましたが、今回は逆に「開いたページでも、いらないものは一切読み込まない」という話です。 関連記事 pop-ancient.hatenabl…

Node.jsのCLI引数を活用し、開発・本番を分岐するテストモードを実装!本番DBを汚すことなく動作確認をする話

こんにちは、にょろりんこの備忘録的ブログです。 今回は、Node.jsのCLI引数を活用し、開発・本番を分岐するテストモードを実装。本番DBを汚すことなく動作確認をするというお話をしていきます。 みなさん、こんな経験ありませんか? スクリプトを試したいけ…

イメージ画像から検索用タグを自動生成するというお話:③スダチ形態素解析編

こんにちは、にょろりんこの技術備忘録ブログです。 今回は、前回の「MythoMaxでキャッチコピー生成」編で得られた日本語タイトルを、さらに検索性の高い語句に分解していく第3ステップ──「形態素解析」編です。 今日の私は言語学者です。 AIが画像から文章…

イメージ画像から検索用タグを自動生成するというお話:②MythoMax日本語変換編

こんにちは、にょろりんこの技術備忘録ブログです。 今回は、前回の『BLIPで画像から自然文のキャプションを生成する』編の続きとなる第2ステップ──英語キャプションを、日本語の自然な一文に変換する「MythoMax日本語変換編」です。 AIが画像から文章をつく…

イメージ画像から検索用タグを自動生成するというお話:①BLIP編

こんにちは、にょろりんこの技術備忘録ブログです。 今回は『イメージ画像から画像検索用のタグを自動生成する』というお話のうち、最初のステップである、『BLIPで画像から自然文のキャプションを生成する』編です。 このシリーズのお話は、Sae-Porns の裏…

プロキシの使用量明細から、不要ドメインを見極めブロックし、プロキシ帯域削減とスピード向上をするというお話

こんにちは、にょろりんこの備忘録的な開発ブログです。 今日は「プロキシの使用量明細をもとに、アクセス不要なドメインを見極めてブロックする」という、地味ながらも効果絶大な最適化のお話です。 Puppeteerを使ってクローリングをしていると、ページにア…

プロキシ会社を比較してわかったこと。Evomiが個人開発で一番使えた話【回転型・住宅IP】

個人開発者による、プロキシ会社選定の備忘録(あくまで個人的な感想です) こんにちは、にょろりんこです。 今回は、個人開発の立場から、これまで試したプロキシサービスについての所感をざっくりまとめておきます。 あくまで備忘録的な投稿ですが、同じよ…

ChatGPTの画像生成AIモデル(DALL·E)がバージョンアップし、マスコットキャラの画風がロストテクノロジーになった話

2025年5月頃、ChatGPTの画像生成AI(DALL·E)が密かに更新されました。 それにより、Sae-Pornsのマスコットキャラ「ティアラ」のあの独特な画風が、再現できなくなってしまったのです。 でもこれは、終わりではなく、進化の始まり。Stable Diffusion系のさま…

Node.jsで不要ページを事前にフィルタリングし、クロール高速化&帯域削減するというお話

※全体のクローリング処理では Puppeteer を使用していますが、この記事で紹介するフィルタリング処理は Node.js 単体で完結しています。 こんにちは、にょろりんこです。 今回は、クローリング処理を高速化&軽量化するために導入している、「事前URLフィル…

Node.js + Puppeteerで noindex ページを検出し、インデクシングを回避するというお話 

こんにちは、あなたを追跡しないポルノ動画検索エンジン、Sae-Porns管理人のにょろりんこです。 検索エンジンを作成する際、あなたのクローラーは noindex をちゃんと避けてますか? クローリング/インデクシングする時に、気をつけなければいけないこと。…

誤検索を防ぐ、ポルノ動画検索エンジンのネーミングSEO戦略の話

こんにちは、にょろりんこです。 今回は、「なぜ “Sae-Porns” という名前にしたのか?」というお話です。 ちょっとギョッとする名前かもしれませんが、これにはちゃんと理由があります。というか、最初はこういう名前ではなかったんです。 最初は「FairyWork…

なぜ「追跡されないポルノ検索エンジン」を作ろうと思ったのか

こんにちは、にょろりんこです。 このブログは、私がひとりで開発している匿名検索サービス「Sae-Porns(えすえーいーぽーんず)」の進捗や裏話、試行錯誤の記録などを綴っていく場です。 初回は、「なんでそんなものを作ろうと思ったの?」という話から始め…