こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

締切り済みの質問

コピー&ペースト時の文字コードは何に依存しますか?

コピー&ペースト時の文字コードに関して質問させてください。

Webページの本文などをコピーし、テキストエディタやブラウザ上のPHPで作ったスクリプトページにコピーなどして、データベースなどに保存した場合、
その文字コードは何になるのでしょうか?

ある場所で質問した際、LANG変数の値じゃないかと言われました。
なのでLinuxを使用している自分の環境でやってみたところ、
$ echo $LANG
ja_JP.utf8
となりました。

このページ(http://www.itmedia.co.jp/help/tips/linux/l0176.html)を参考に/etc/profile内を見てみたのですが、LANGに関するものは見当たりませんでした。
ま、UTF-8で設定されているのでUTF-8で統一したい自分にとってはそれで良いのですが。


で、もし対象のWebページのHTMLが例えEUC-JPやShift-JISで書かれていたとしても、
Linuxでコピペした場合は文字コードはUTF-8と考えてもいいのでしょうか?


こういうページ(http://okwave.jp/qa/q2940513.html)にも質問ありましたが、環境がWindowsの為分かりませんでした。

投稿日時 - 2014-02-24 14:28:39

QNo.8488508

すぐに回答ほしいです

このQ&Aは役に立ちましたか?

8人が「このQ&Aが役に立った」と投票しています

回答(2)

ANo.2

ウェブブラウザーでシフトJISで書かれたサイトを表示しても
正常に日本語で表示されているのであれば
そのウェブブラウザーの動く環境の、標準の文字コードに変換されていますよ。

コピー操作は、そのもとのシフトJISのHTML文書に対してではなく
ウェブブラウザーが表示しているUTF-8の文字列に対して行われるので

必然的に、OSがUTF-8を標準としていれば
UTF-8の文書からのコピーアンドペーストということになります。


やったことがありませんが、charsetが間違っているサイトでは化けた状態で表示されるでしょ?
その状態から全文コピペすると、化けたまま別のソフトのペーストされますよ。

投稿日時 - 2014-02-25 07:13:23

ANo.1

X Windows Systemのクリップボードであれば、ISO2022ベースのコンパウンドテキストという文字コードです。
https://www.google.co.jp/search?q="コンパウンドテキスト"

アプリケーション側で使う文字コードとは自動的に変換されるはず。

投稿日時 - 2014-02-24 14:54:43

お礼

ご回答ありがとうございました。

という事は、データベース格納時に、
一応現在の文字コードを自動で判別してからUTF-8に変換し、データベースへ格納した方が文字化けに悩まされず良さそうですね?

テキストエディタなどもおそらくデータの保存時に、デフォルトの文字コード(最近ではUTF-8)に変換しているのかもしれないと思いました。

投稿日時 - 2014-02-24 21:02:10

あなたにオススメの質問