chatGPTでサンプルデータ作成

 

便利な世の中になりました。chatGPTがサンプルデータを作成してくれるなんて。

でもまだまだ生成AIを業務利用してはいけないという社内ルールがある会社も多いのではないでしょうか。私も業務利用できない側の所属だったので、泣く泣く手作業でサンプルデータを作成しました。本当に適応障害になるかと思った。。

今回はあくまで個人利用としてchatGPTでサンプルデータ作成したときのchatGPTとの会話を公開します。

全文はこちらから見ることができます。

https://chat.openai.com/share/97ba5cca-d38a-4431-8263-1b3987a09635

 

 

初期のインプットのPurchaseOrderはこちらから拝借しました。

サンプル XSD ファイル: シンプルなスキーマ - Visual Studio (Windows) | Microsoft Learn

 

 

総評として非常に優秀で実務でも使えそうな印象をうけました。

<よかったところ>

・レコードの追加、削除が容易

・レコードのIDで対応付けができる

・ランダム文字列が重複することがない

・XSDからXML / XMLからXSD ができる

 

<悪かったところ>

・時間の前後関係で指示が通らなかった

 

まず、よかったところから。

正確に計測していないのですが、ものの15分やそこらでいい感じのXML / XSDが作成できます。手作業でやると大変なレコード追加も「レコードを○件追加して」の一言でできます。

驚いたのはidの紐づけですね。これでレコード同士でjoinすることも可能です。

手作業でコピペしてたらランダム文字列を修正しわすれて重複するということも多々ありますが、chatGPTにお願いしたら重複することはありませんでした。ただ、規則性のあるランダム文字列だったのでもっとシャッフルしてほしい場合は追加で依頼する必要がありそうです。(「SHA256を使って」など)

また、今回はXMLでしたがその他Jsonやymlなんかでも応用できそうです。

そして今回使ったchatGPTは3.5なので無料なのです。

はやい、うまい、やすいの三拍子、お見事です。

 

次に悪かったところ。

支払いが終わってから配送するというユースケースの場合、支払いの時刻よりも後に配送の時刻になるようにしなければなりません。

「対応するBillToとShipToのtimestampは必ずBillToが先、ShipToが後になるようにしてください。
対応するBillToとShipToのレコードを1件追加してください。」

このオーダーはうまく通らず、時間の前後関係がばらばらになってしまいました。

「同じbill_idのBillToとShipToのレコードは、BillTo の timestamp が ShipTo のtimestampよりも先になるようにしてください。」

このオーダーでうまく通りました。同じに見えるのですが、人間側のオーダースキルも試されますね。

 

今回はchatGPTでサンプルデータを作成した所感について書きました。

早くAIに仕事をとられたいですが、まずは生成AIを業務で利用できる環境作りからですかね。

 

次回は生成AIを業務で利用できない場合にPythonでサンプルデータを作成する方法について書く予定です。お楽しみに。