ぽっぺんしゃんにょろりんこ

匿名・非追跡型アダルト動画検索エンジンの設計ノート

2025-06-01から1ヶ月間の記事一覧

頑張るだけ損!社内ニートでも給料がもらえる会社は普通の人にとって地獄

こんにちは、にょろりんこの雑記ブログです。 みなさんの職場にも、いつもぼーっとパソコンとにらめっこしてるだけで、仕事は全然進まないのに、給料だけはしっかりもらってる人、いませんか? 一生懸命働いている人からしたら、正直納得いかないですよね。 …

Pythonで作る形態素解析API:SudachiPyとFlaskで最速分割サーバー構築①

こんにちは、にょろりんこの備忘録的技術ブログです。 今回のテーマは形態素解析です。 日本語テキストを扱うなら必ず通るこの処理は、検索クエリのタグ生成といった、自然言語処理全般で欠かせないステップです。 日傘をさすティアラ 私が運営しているAV検…

不安を煽って課題を作れ!スペクター的ビジネスモデルの研究

こんにちは、にょろりんこの雑記ブログです。 みなさんはスペクターって知っていますか? 映画『007』シリーズに登場する、世界を裏から操る犯罪組織。どんな悪い奴かというと、A国とB国の間に不安を煽り戦争をプロデュース、そのあとに自社の商品である「兵…

SESは絶対にやめましょう。その理由を構造から説明します。という話

こんにちは、にょろりんこブログです。 今日は「SESだけはやめておけ」とよく言われる理由について、感情論ではなく「構造」の視点から整理しておこうと思います。 ネットを見ると、「SESは地獄」「スキルが伸びない」「年収が上がらない」といった声があふ…

「人を雇うなら、年収500万円は最低ライン。」──採用/定着も競争だ。という話。

こんにちは、にょろりんこの雑記ブログです。 今日は、本業の事業再生系コンサルで「人が来ない」「人がすぐ辞めてしまう」といった相談を受けたので、それに対して私がいつもお伝えしている考え方を、ブログにも残しておこうと思います。 結論から言うと、…

SEOに強い!SPAでもできる動的生成の構造化データ(JSON-LD)の話

こんにちは、にょろりんこの備忘録的技術ブログです。 みなさん、構造化データ(JSON-LD)って使っていますか? 検索エンジン、特にGoogleに「このページは何を扱っているか」を正しく伝えるための仕組みで、リッチリザルトにも表示される重要な要素です。 J…

PHPとjQueryで作る、動画サムネから動画詳細(メインエリア)を非同期で表示するUIの話

こんにちは、にょろりんこの備忘録技術ブログです。 Webサイトで「一覧ページのサムネイルをクリックしたら、詳細情報がその場で表示される」──そんな直感的なUIを見たことがあると思います。ページ遷移なしに内容が切り替わるこの仕組み、実は PHPとjQuery…

CTRを正しく計測するためにBOTによる表示カウントを除外する方法

こんにちは、超ニッチ&尖りまくりの、にょろりんこの備忘録的技術ブログです。 前回の記事では、動画の人気ランキングにとって非常に重要な クリック数(selected)のカウント において、Botアクセスを除外する方法を紹介しました。 JavaScript上で生成した…

個人情報を追跡せずにできる!CryptJSでボットクリックからDBを守る方法

こんにちは、にょろりんこの備忘録的技術ブログです。 SaePornsでは、動画の人気度や関連ワードの精度を上げるために、CTR(クリック率)を計測しています。 これは「特定の検索語で表示された動画のうち、実際にどれがクリックされたか」を記録するもので、…

検索機能をAPIに切り出して軽量化!個人製検索エンジンで試した責務分離の実践例

こんにちは、にょろりんこの備忘録的技術ブログです。 今回は、個人で開発・運用している検索エンジン「SaePorns」の内部構成を見直した話です。 検索機能のコードが次第に肥大化してきたため、思い切って検索処理を外部APIとして分離し、処理の責任を整理し…

マイケル・ポーター『競争の戦略』で考えるSaePornsの競争戦略というお話

こんにちは、にょろりんこの備忘録ブログです。 今回は、前回書いた『グーグルやDMMに勝てるのか?個人開発のアダルト動画検索エンジンの生き残り戦略という話』に思いのほか反響があったので、もう少し「戦略」という視点から深掘りしてみたいと思います。 …

グーグルやDMMに勝てるのか?個人開発のアダルト動画検索エンジンの生き残り戦略という話

こんにちは、にょろりんこの備忘録ブログです。 個人でプロダクトを開発していると、必ずと言っていいほど頭をよぎるのが「この先、大資本が本気で参入してきたらどうする?」という問いです。 検索エンジンを作れば、グーグルがいる。アダルト領域なら、DMM…

免責事項オーバーレイでプライバシーを守りつつ年齢認証をする話

こんにちは、にょろりんこの備忘録的技術ブログです。 今日は、Sae-Pornsのトップページに表示している免責事項オーバーレイについて紹介します。 いわゆる「未成年の利用を防ぐための年齢確認+利用規約への同意画面」ですが、実はこの小さなオーバーレイに…

ジョブズ気取りの暴言エンジニアがこの先生きのこれない理由と、私がSaePornsを作る理由

こんにちは、にょろりんこの備忘録的技術ブログです。 今日はちょっと毒っぽい話。 あなたの職場にもいませんか? 話しかけると「黙ってろ」と怒鳴る、「ジョブズ気取り」の暴言エンジニア。 私の昔の職場にもいました。誰にでも偉そうな態度をとり、指摘す…

IT業界に入りたいなら、地方の国公立大学でコンピューターサイエンスを学ぼう。SESは闇しかない。という話

こんにちは、にょろりんこの備忘録的ブログです。 今回は、これからIT業界を目指そうとしている人に向けた“人生を左右する選択”についてのお話です。 結論から言います。 SESなんて選んでる場合じゃない。ちゃんとコンピューターサイエンス(CS)を学べる場…

Node.jsで、もうクロールしないURLと、またクロールするURLを分けてフラグ管理する話

こんにちは、にょろりんこの備忘録的技術ブログです。 今回は、私が自作している Node.js 製のクローラーの中で使っている flag-update.js という小さなファイルについて紹介します。 ティアラ_手をマルにする このファイルの役割はとてもシンプルで、対象の…

PHPのproxy.phpがFPMを詰まらせていた ─ サムネイル画像のcurlがタイムアウトせず重くなる話

こんにちは、にょろりんこの備忘録的技術ブログです。 今日は、運営中の匿名検索エンジン「Sae-Porns」が「なんか変…」という現象に悩まされていました。 ページがやたらと重い。サムネイルがいつまで経っても表示されない。最悪、白画面のまま固まることも……

プログラミングスクールに50万円払うの、コスパ悪すぎて選択肢に入らない話

こんにちは、にょろりんこの備忘録的ブログです。 この前書いたプログラミングスクールで「手に職つけて在宅ワーク」は詭弁では?というお話が思いのほかアクセスがあったので、今回はその続きを書こうと思います。 www.n-rinko.com あらためて結論から言い…

Node.jsでURL正規化!末尾スラッシュやアンカーを除去する「normalizeUrl」関数の話

こんにちは、にょろりんこの備忘録的技術ブログです。 今日は、クローリングやリンク収集処理の地味だけど超重要なパーツ、「URLの正規化」についてのお話です。 私が運用しているURLスクレイピング系のURL収集スクリプトでは、同じページを重複して処理しな…

プログラミングスクールで「手に職つけて在宅ワーク」は詭弁では?というお話

こんにちは、にょろりんこの備忘録的ブログです。 先日、昔の友人と久しぶりに会う機会がありました。彼は最近、とあるプログラミングスクールの法人営業職に転職したらしく、「未経験人材を育成して、企業に送り出すビジネス」の話を熱心にしてくれました。…

Node.jsで同一ドメインのリンクだけを抽出する。際限のないフェッチングを制限するfilter関数の話

こんにちは、にょろりんこの備忘録的技術ブログです。 今日は、Node.js製のWebクローラーでシードURLからリンクをたどる際に役立つ、同一ドメイン限定のフィルタ関数について紹介します。 クローラーの処理は、最初の1件――いわゆるシードURLから始まります。…

3,000時間プログラミングをしてわかった、プログラミングスクールという幻想という話

こんにちは、にょろりんこの備忘録的技術ブログです。今日は少しリアルリアルな話をします。 私はこの4年間、毎日のように独学でコードを書き続け、累計たぶん3,000時間を超えるプログラミングをしてきました。HTMLとjQueryの入力欄から始まり、PHP、MySQL…

Node.jsでループ処理+データベースをフラグ管理!未処理URLだけを自動でクローリングする話

こんにちは、にょろりんこの備忘録的技術ブログです。 今日は「Node.jsで未処理のURLだけを自動で回していくループ処理モジュール」を紹介します。名前は `loop.js`。このコードはすごく地味だけど、WebクローラやURL収集バッチの「心臓部」とも言える存在で…

PuppeteerとNode.jsで自動クロール。動的・静的ウェブページのURLを抽出するというお話

こんにちは、にょろりんこの備忘録的技術ブログです。 今回は、自作クローラシリーズの中核ともいえる「URL収集ロジック」について紹介してみようと思います。 静的なHTMLページはもちろん、JavaScriptでリンクが後から描画される動的ページ(SPAなど)にも…

プロキシが回転型じゃなかったので、自前でIPローテのコードを書いた話

こんにちは、にょろりんこの備忘録的技術ブログです。 今回は、検索エンジンのインデクシングでよく使われる「回転型プロキシ」について、実際に契約してみたところ、全く回転しなかったという話と、そこから自前でIPローテーションの制御コードを作った過程…

PythonとMythoMaxで外国語AVタイトルを自然な日本語に変換するモジュールを作るという話

こんにちは、にょろりんこの備忘録的技術ブログです。 今回は、外国語のAVタイトルから自然な日本語のキャッチコピーを生成する専用モジュール generate_mytho_only.py について紹介します。画像キャプションやタグ生成の処理でもMythoMaxを使っていますが、…