Python
◾️はじめに https://dk521123.hatenablog.com/entry/2025/12/19/233012 で「SDV (Synthetic Data Vault)」っていうのを知ったので 調べてみた 目次 【1】SDV (Synthetic Data Vault) 1)合成データとは? 2)主要モデル 【2】インストール 【3】サンプル…
◾️はじめに https://dk521123.hatenablog.com/entry/2025/12/19/233012 で「Faker」っていうのを知ったので調べてみた (めちゃめちゃ簡単に使える!!) 目次 【1】Faker 【2】インストール 【3】サンプル 例1:Hello world 例2:ダミーCSVデータ 【4…
◾️はじめに 小ネタ。 pytest を実行した際に、自作したライブラリが見つけられず エラー「ModuleNotFoundError」が発生していた。 その際に、「__init__.py」を追加することにより、解決できた。 そこで、今更だが、「__init__.py」について扱う。 【1】__i…
◾️はじめに Pythonのcroniterについて調べて、試したので、 記録しておく 目次 【1】croniter 【2】インストール 補足:pyawscron (AWSのCron形式) 【3】サンプル 例1:croniter 【4】Tips 1)UTC形式にする 【1】croniter * croniter(クロニター) …
◾️はじめに Pythonでのファイル暗号化・復号化のためのライブラリ python-gnupg について扱う 目次 【1】前提知識:GnuPG 【2】python-gnupg 1)インストール 【3】サンプル 例1:キー生成・暗号化・復号化 例2:署名・検証(sign / verify) 例3:公…
◾️はじめに https://dk521123.hatenablog.com/entry/2025/10/07/133808 https://dk521123.hatenablog.com/entry/2025/10/10/013250 の続き。 今回は、SQLAlchemyのTipsなどをまとめておく 目次 【1】ページネーション 1)Order By 2)LIMIT 3)OFFSET 【…
◾️はじめに https://dk521123.hatenablog.com/entry/2025/10/07/133808 の続き。 今回は、SQLAlchemyの基本的な知識を書き溜めておく。 目次 【1】テーブル定義 1)データ定義 2)初期化としてのCREATE TABLE 【2】SELECT 1)WHERE句 【3】INSERT 【4…
◾️はじめに Python の ORM(Object-Relational Mapping)の SQLAlchemyについて、扱う 目次 【0】Python ORM 【1】SQLAlchemy 【2】インストール 【3】サンプル 例1:SQLite 例2:PostgreSQL 【0】Python ORM ORMライブラリ 特徴 SQLAlchemy 最も有名…
◾️はじめに https://dk521123.hatenablog.com/entry/2025/10/05/014051 の続き。 今回は、Python の WebフレームワークであるFastAPIでの ファイルアップロードについて扱う # これで、あと、FastAPI のDBの扱いさえ覚えれば、 # バックエンド側でやりたいこ…
◾️はじめに PythonのWEBフレームワークのFastAPIを扱う。 目次 【0】PythonのWEBフレームワーク 【1】FastAPI 【2】インストール 【3】Hello world Step1: コードを書く Step2: サーバ起動 Step3: 動作確認 【0】PythonのWEBフレームワーク フレームワ…
◾️はじめに https://dk521123.hatenablog.com/entry/2025/10/03/141326 の続き。 今回は、pythonで、PDF -> TEXT を行う。 目次 【1】PyMuPDF 【2】PyMuPDF4LLM 【3】pdfminer.six 【1】PyMuPDF * PDFの構造を検出し、データを抽出するツール 1)インス…
◾️はじめに やりたいこと 『画像又はPDFの情報からデータを抽出し、DBに入れるシステムを作成したい (無料のツールで)』があり、以下「【5】おまけ:構想していること」の 「1)処理フロー」と「2)システム構成」で考えている。 まず、その中の「Tessera…
◾️はじめに https://dk521123.hatenablog.com/entry/2025/06/07/230713 の調査の一環として、 Pythonでs3上のPandasファイルをダウンロードせずに参照する方法を Github Copilotに聞いたところ、「s3fs」を教えてくれたので メモってみた 目次 【1】s3fsラ…
◾️はじめに 今更ながら、Pythonのリスト内包表記(List comprehensions) について扱う。 目次 【1】リスト内包表記(List comprehensions) 1)例 【2】リスト内包表記の種類 1)配列(list) 2)集合(set) 3)辞書(dict) 【3】リスト内包表記の…
◾️はじめに Python で辞書リストの重複を排除するために 色々調べたら、frozensetってのを使ったのでメモ。 目次 【1】frozenset 1)仕様 【2】用途 1)辞書のキーとして利用 【3】frozensetの利用例:辞書リストの重複排除 1)完全一致で重複排除 2…
◾️はじめに Jinja2の繰り返し(ループ)についてメモ。 目次 【1】for文 【2】ループの制御文 1)break文 2)continue文 【3】loop 1)主なメソッド 2)サンプル 【4】使用上の注意:変数をループする場合の注意点 1)NG例 2)OK例 【1】for文 サン…
◾️はじめに Jinja2の条件分岐についてメモ。 目次 【1】if文 1)サンプル 【2】論理演算子 1)サンプル 【3】三項演算子 1)サンプル 【1】if文 {% if 条件式1 %} {# 条件式1が true なら実行される #} {% elif 条件式2 %} {# 条件式2が true なら実…
◾️はじめに Jinja2で変数が文字列もしくは1要素のタプルの場合、文字列として扱い 1文字づつループされてしまい、その対策として変数をチェックすることを 調べたので、Jinja2の変数全般をまとめてみた 目次 【1】変数定義 【2】変数参照 【3】変数チェ…
◾️はじめに 小ネタ。 dbt の macro を作っていてSyntax errorを回避するために do文(do statement)を使った。 ただ、調べてみてもいい解説しているページが見つからなかったので 自分なりの解釈でまとめてみた 目次 【0】do文の公式ドキュメントの解説 【…
◾️はじめに Python の bool については https://dk521123.hatenablog.com/entry/2021/10/02/000000 でやったが、別の問題でハマったので、 この際だから、今回は、Pythonの bool を扱う際の注意事項について まとめてみようと思う。 目次 【0】前提知識:Py…
◾️はじめに 今更だが、Pythonのアンパックについて扱う 目次 【0】アンパックを意識したきっかけ 1)現象概要 2)出力結果(エラーメッセージ) 3)解決案 【1】アンパック(unpack) 1)サンプル 【2】アンパックするための演算子 1)*演算子(スタ…
◾️はじめに https://dk521123.hatenablog.com/entry/2021/11/28/113711 で、Pythonの抽象クラスのサンプルを作った際に、 「Class properties are deprecated in Python 3.11 ...」が表示した。 警告文の内容的に、将来的には、動かなくなるコードになりそう…
■ はじめに 今日、業務で、「streamlit」ってのがでてきて どうも、Snowflake が streamlit を買収され、 https://www.snowflake.com/ja/blog/snowflake-to-acquire-streamlit/ Snowflake上でも動く(Streamlit in Snowflake)とか話題になった。 https://do…
■ はじめに Jinja2がベースになっている dbt を使っていて 空白行が異常にできて見づらい。 また、それが原因かは不明だが、メモリエラーも発生しており いずれにせよ、余分な空行はない方がいいので、調べてみたら、 Jinja2 には、Whitespace Control 機能…
■ はじめに Jinja2で 既存のリストから特定の文字列を除外したかったが、 https://dk521123.hatenablog.com/entry/2024/10/19/000848 で記載したように、リスト内包表記がサポート外とのことだったので、 大分ハマっていたら、フィルタのrejectでやりたいこ…
■ はじめに https://dk521123.hatenablog.com/entry/2024/10/18/001757 https://dk521123.hatenablog.com/entry/2023/11/28/235951 https://dk521123.hatenablog.com/entry/2024/09/11/003301 https://dk521123.hatenablog.com/entry/2018/09/22/142348 等で…
■ はじめに dbt で macro を修正する必要があり、 jinja2の基本的な文法事項が分かっていなかったので まとめておく。 目次 【1】基本 【2】コメント文 1)使用上の注意 【3】変数 1)変数定義 2)変数参照 【4】if文 1)論理演算子 【5】for文 1…
■ はじめに Parquet ファイルを扱うことになり、テストデータを作りたいので Pythonであれば、Pandas でParquet を扱うのが一番楽そうなので 個別にまとめておく 目次 【1】インストール 【2】Parquet の書き出し・読み出し 1)出力・書き出し 2)入力・…
■ はじめに https://qiita.com/python_academia/items/a54a6d1dcc5a12875c88 を読んでいた際に、 Scala で気に入っている match文が、Python3.10以降から 使えるとのことので、メモっておく 目次 【1】match文 1)使用上の注意 【2】サンプル 例1:Hello…
■ はじめに dbt Core v1.7 を使っているのだが、 以下の公式ドキュメントを確認したところ、 もうすぐサポートが切れる https://docs.getdbt.com/docs/dbt-versions/core dbt Core Initial release Support level and end date v1.8 May 9 2024 Active — May…