投稿

4月, 2022の投稿を表示しています

Macにログインと同時にAutomatorで作ったアプリを実行する

やりたいこと RPAソフトを使って、ブラウザを自動操作する。 →クラウド型の勤怠管理システムに自動打刻したい。 RPAソフトはMac標準でインストールされている「Automator」を使用する。 Macにログインしたら、Automatorで作成した上記アプリを実行する。 注意 この方法はオススメしません。 ブラウザを自動操作して勤怠管理システムの出勤打刻時間をクリックする。 というRPAを作成するわけですが、何かしらの理由で意図した箇所をクリック出来なかった場合、Macがバグります。マウスカーソルが操作不能になります。 私の場合、↓の理由で何度も操作不能に陥りましたw RPAでの自動操作中にトラックパッドでマウスカーソルを移動する。 RPAにブラウザ操作を記録させた時とブラウザの表示サイズを変えていた。 ログイン時にRPAを起動してブラウザを自動操作するようにしていたが、ログイン時に同時に起動される他アプリが邪魔してブラウザの画面をクリック出来なかった。 特に3つ目が厄介で、ログインする度に発生→マウス操作不能→再起動のループになります。 幸いにもログインしてからRPAが実行されるまで間隔があったので、ログイン後にすぐさま対象のRPAアプリ(この記事でいうnews.app)を削除することで無理やり止めたりしてました。 Automatorでブラウザを自動操作するアプリを作成 勤怠管理システムの例を記事にするわけにはいかないので、サンプルとしてYahooニュースの1番目の記事を開くアプリを作ります。 手順1. 「Finder」から「アプリケーション」>「Automator.app」を開く。 手順2. ファイル選択画面が表示されるので、右下の「新規書類」を選択後、「アプリケーション」を選択します。   手順3. 左メニューから「指定されたURLを取得」選択して右の領域にドラッグ&ドロップします。その後、「アドレス」に開きたいWEBページのURLを入力します。 手順4. 左メニューから「Webページを表示」選択して右の領域にドラッグ&ドロップします。 手順5. 右上のメニューの「実行」をクリックして、開きたいページが開かれるか確認します。 手順6. 右上のメニューの「記録」をクリックして、ブラウザの操作を記録させます。この時に注意するのは、最初にブラウザのウィ...

FFmpeg + ESRGANで低画質動画の超解像に挑戦

目的 約10年に自分のライブで撮影された540×360pxの低画質の動画をESRGANの超解像技術でスケールアップする。 前回の記事を振り返る 前回 は話題性だけで選定したTecoGANを使って超解像に挑戦しましたが、結果がイマイチで綺麗にスケールアップされませんでした... ※全体的に気持ち綺麗にはなりましたが、「超解像か?」と言われると全然な結果でした。 ESRGANを選んだ理由 はじめに言っておくと筆者はAIモデルのアーキテクチャについてはまったくの素人です。 参考に見た論文 を見ても、頭が追いついていけません。が、それでいいと思います。道具は使えることが大切で、どういう仕組で作られてるのか、その中身まで細かく知る必要はないと思ってます。 ちなみにESRGANはEnhanced Super-Resolution Generative Adversarial Networksの略で、「Enhanced=強化された=何か凄そうw」程度の気持ちで使ってみます。 筆者の環境 OS Ubuntu 20.04 LTS(WSL2) Pythonバージョン 3.7.12 GPU RTX2070 Super メモリ 32GB 手順 手順は基本的に 前回やったTecoGAN と同じでFFmpegで動画フレームを抜き出して画像に変換し、その画像をESRGANでスケールアップしてFFmpegで動画に戻します。 最終的なディレクトリ構成 ESRGAN ├ LR ← FFmpegで動画から抜き出した画像を格納するディレクトリ │ ├ image_xxxxx.png │ └ image_xxxxx.png ├ results ← ESRGANで超解像化した画像を格納するディレクトリ │ ├ image_xxxxx_rlt.png │ └ image_xxxxx_rlt.png ├ models ← ダウンロードしたモデルを格納するディレクトリ │ └ README.md ← モデルの説明を記載したファイル │ └ RRDB_ESRGAN_x4.pth ← Googleドライブからダウンロードしたモデル ├ movie.mp4 ← 超解像前の動画...