ja_JP.UTF-8
■ このスレッドは過去ログ倉庫に格納されています
1login:Penguin
04/02/19 17:09ID:EuXdEmYH Linux で ja_JP.UTF-8 ロケールで暮らす方法についてのスレです。
05/03/07 02:10:29ID:233WSAJL
なんで UTF-8 の変換にエンディアンが関係するんdayo!
って一瞬思ったけど、iconv の内部的には一旦 UTF-16 とかにしてるのかな?
Apple のハックのせいなんなら普通の libiconv と比較してみたらいいんじゃねーの?
それか普通の libiconv にその UTF-8-MAC を追加する方向で修正してみるとか
...ってのができないわけね。
Mac OS X が使えるなら Mac OS X 上で変換してから他のプラットフォームに持って
いくんじゃ駄目なのか?
って一瞬思ったけど、iconv の内部的には一旦 UTF-16 とかにしてるのかな?
Apple のハックのせいなんなら普通の libiconv と比較してみたらいいんじゃねーの?
それか普通の libiconv にその UTF-8-MAC を追加する方向で修正してみるとか
...ってのができないわけね。
Mac OS X が使えるなら Mac OS X 上で変換してから他のプラットフォームに持って
いくんじゃ駄目なのか?
05/03/07 12:53:14ID:v/gznSFy
05/03/08 12:02:39ID:FpUM9LjU
ja_JP.UTF-8 ロケールでeuc-jpのnfs鯖をマウントするときみんなどうやってるの?
(sambaや、webdav使えばできるんだけどネ、nfsでの解決策を教えてね)
(sambaや、webdav使えばできるんだけどネ、nfsでの解決策を教えてね)
178175
05/03/08 12:30:30ID:p+KoiNpg 問題が本当にエンディアンのせいなら、utf8mac_mbtowc() が呼んでいる
utf8_decodestr() の引数に UTF_REVERSE_ENDIAN をセットしてみたらいいかも。
ハードコーディングになっちゃうけど。
それで駄目だったら >>176 の回答待ちか。
utf8_decodestr() の引数に UTF_REVERSE_ENDIAN をセットしてみたらいいかも。
ハードコーディングになっちゃうけど。
それで駄目だったら >>176 の回答待ちか。
179174
05/03/10 00:01:21ID:AGM4jA9o >>176
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-9.tar.gz
をダウンロードして、
./configure --enable-static=yes --enable-shared=no --disable-nls --prefix=/opt/mac
としてconfigureしてmakeして、スタティックリンクしたバイナリを作って実験してみました。
ls | iconv -f UTF-8-MAC -t UTF-8
で、NKDな文字がちゃんと出てくるか調べてみたのですが、めちゃくちゃな文字化けしか起こりませんでした…
>>178
UTF_REVERSE_ENDIANをセットしてみてもしなくてもですが、めちゃくちゃに文字が化けてしまいました。
一つ怪しいかなと思うのが、
utf8mac.h: In function `utf8mac_mbtowc':
utf8mac.h:1566: warning: passing arg 6 of `utf8_decodestr' makes integer from pointer without a cast
なんてwarningがでるんですが、もしかしてこれのせいでPowerPCでしか動かないコードになっていることなんです。
でもCが全くわからないので意味はわからないのですが…
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-9.tar.gz
をダウンロードして、
./configure --enable-static=yes --enable-shared=no --disable-nls --prefix=/opt/mac
としてconfigureしてmakeして、スタティックリンクしたバイナリを作って実験してみました。
ls | iconv -f UTF-8-MAC -t UTF-8
で、NKDな文字がちゃんと出てくるか調べてみたのですが、めちゃくちゃな文字化けしか起こりませんでした…
>>178
UTF_REVERSE_ENDIANをセットしてみてもしなくてもですが、めちゃくちゃに文字が化けてしまいました。
一つ怪しいかなと思うのが、
utf8mac.h: In function `utf8mac_mbtowc':
utf8mac.h:1566: warning: passing arg 6 of `utf8_decodestr' makes integer from pointer without a cast
なんてwarningがでるんですが、もしかしてこれのせいでPowerPCでしか動かないコードになっていることなんです。
でもCが全くわからないので意味はわからないのですが…
2005/06/06(月) 13:22:58ID:1kxaCCcu
>>179
気になったので試してみたけど、
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-10.tar.gz
や
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-13.tar.gz
なら
-#include <libkern/OSByteOrder.h>
+//#include <libkern/OSByteOrder.h>
+#include <byteswap.h>
+#define OSSwapInt16(x) bswap_16(x)
+#define __LITTLE_ENDIAN__
という変更でいけるみたい。
気になったので試してみたけど、
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-10.tar.gz
や
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-13.tar.gz
なら
-#include <libkern/OSByteOrder.h>
+//#include <libkern/OSByteOrder.h>
+#include <byteswap.h>
+#define OSSwapInt16(x) bswap_16(x)
+#define __LITTLE_ENDIAN__
という変更でいけるみたい。
181naruse
2005/07/07(木) 20:26:04ID:Ajp7X6MQ nkfの最新のCVS版で、
nkf -w --utf8mac-input hoge.txt
などとすればUTF-8-MACをUTF-8に変換できる・・・はずです。
うまくいかない場合は教えてください。
nkf -w --utf8mac-input hoge.txt
などとすればUTF-8-MACをUTF-8に変換できる・・・はずです。
うまくいかない場合は教えてください。
182login:Penguin
2005/07/13(水) 03:15:25ID:GiU0rXXK183login:Penguin
2006/01/10(火) 14:40:21ID:s0uQ10WF あけおめage
184login:Penguin
2006/01/18(水) 17:33:51ID:1b8YR8q0 フェどらって、OSの仕様をかえればすぐにソフトの仕様もかわると思ったのかな?
2006/01/21(土) 16:33:52ID:e7e/lB8H
「すぐに」とは思ってないんじゃない。
2006/02/01(水) 08:31:41ID:H6kL8c39
使っているOSがUTF-8なのかEUC-JPなのか
簡単に判別する方法はあるでしょうか?
とりあえず、今1CDのGeeXboXを日本語対応化してみていますが
USBメモリー(vfat)上のファイル名は正常に表示されますが
HDD上のファイルがうまくいっていません。
たぶん、このHDDへのファイル保存をVineでやっているので
未だEUC-JPのVineだってところか
あるいはGeeXboX側のmount optionの問題か…手詰り。
UTF-8標準に向かったディストリビューションには
ファイル名をUTF-8化するコマンドがあるようですが
とりあえず、Vineではapt-getはできないようで…
いっそ、UTF-8標準のディストリビューションを入れちゃうか?と思ったり。
それとも、FedoraCoreからconvmvのソースとってくるほうが速いのか?
どちらにしろ、もう遅刻する時間を過ぎているので出勤しまつ orz
ちなみに、GeeXboXはlibsmbなんとかやfstabが
ラムディスクイメージの中にあるので、今私には手が出せません。
#気の迷いでパソコン一般板にGeeXboXスレ立て公開中
簡単に判別する方法はあるでしょうか?
とりあえず、今1CDのGeeXboXを日本語対応化してみていますが
USBメモリー(vfat)上のファイル名は正常に表示されますが
HDD上のファイルがうまくいっていません。
たぶん、このHDDへのファイル保存をVineでやっているので
未だEUC-JPのVineだってところか
あるいはGeeXboX側のmount optionの問題か…手詰り。
UTF-8標準に向かったディストリビューションには
ファイル名をUTF-8化するコマンドがあるようですが
とりあえず、Vineではapt-getはできないようで…
いっそ、UTF-8標準のディストリビューションを入れちゃうか?と思ったり。
それとも、FedoraCoreからconvmvのソースとってくるほうが速いのか?
どちらにしろ、もう遅刻する時間を過ぎているので出勤しまつ orz
ちなみに、GeeXboXはlibsmbなんとかやfstabが
ラムディスクイメージの中にあるので、今私には手が出せません。
#気の迷いでパソコン一般板にGeeXboXスレ立て公開中
187login:Penguin
2006/02/01(水) 10:57:17ID:5OoK6VSB age
OS が UTF-8 ってのは
UTF-8 対応のロケールが入っているかどうか?という意味なんでしょうかね。
OS が UTF-8 ってのは
UTF-8 対応のロケールが入っているかどうか?という意味なんでしょうかね。
188login:Penguin
2006/02/01(水) 11:00:41ID:fQfoX2Vz >>187
だね。kernelはutf-8対応なんかしちゃいないよ。
だね。kernelはutf-8対応なんかしちゃいないよ。
189login:Penguin
2006/02/01(水) 13:51:37ID:IyxnkmjE >>188
ん?VFATとかsmbfsなどのNLSにUTF-8が入ってるけど?
他のUTF-8/16なOSとファイルレベルで互換とらないといけないFilesystemはカーネルレベルでNLSサポートしてますよん。
ん?VFATとかsmbfsなどのNLSにUTF-8が入ってるけど?
他のUTF-8/16なOSとファイルレベルで互換とらないといけないFilesystemはカーネルレベルでNLSサポートしてますよん。
190login:Penguin
2006/02/01(水) 15:11:08ID:fQfoX2Vz それドライバの話でしょ。カーネルからはNUL端の文字列にすぎないよ。
2006/02/01(水) 16:05:56ID:qAxvh4Kn
ドライバがカーネルかどうかなんでどうでもいいから
2006/02/01(水) 18:36:18ID:/PUwsy/N
カーネルをソースからコンパイルするときに
ファイルシステムのエンコーディングを
UTF-8だのSJISだのEUCだの指定できるのはなんなんだろうね。
ファイルシステムのエンコーディングを
UTF-8だのSJISだのEUCだの指定できるのはなんなんだろうね。
2006/02/01(水) 21:30:09ID:/ik9G5r3
194login:Penguin
2006/02/01(水) 22:51:36ID:axKot8bp EUCで書かれたシェルスクリプトをUTF-8でごちゃごちゃいじって、
おなじファイルなのに容量が増えることに愕然としたりして、
それでもいじってとりあえず動くものができたんですが、
日本語の文字化け以外にはやう゛ぁイことって何も無いですよね?
おなじファイルなのに容量が増えることに愕然としたりして、
それでもいじってとりあえず動くものができたんですが、
日本語の文字化け以外にはやう゛ぁイことって何も無いですよね?
2006/02/02(木) 09:08:46ID:Gkp5Be+f
おまえ
196186
2006/02/02(木) 21:37:38ID:I2B8ecnQ とりあえず、LOCALEの設定箇所を調べて
そこを確認すればわかるってことでいいようですね。
それはそうと、アクセス規制の一日の間に
convmvでUTF-8ファイル名にしたら当座の目的は解決。
ともかく、ありがとうございました。
そこを確認すればわかるってことでいいようですね。
それはそうと、アクセス規制の一日の間に
convmvでUTF-8ファイル名にしたら当座の目的は解決。
ともかく、ありがとうございました。
197login:Penguin
2006/03/09(木) 13:51:20ID:Bujq6YPa はじめてRedHatES4いれてみた。
# /etc/init.d/xinetd reload
繹・秧莨若榛 [ OK ]
ってな出力がUTF-8ででてるっぽいんだけど
これってEUC-JPに変更できないのかなあ。
ES3まではEUC-JPだったのに。
# /etc/init.d/xinetd reload
繹・秧莨若榛 [ OK ]
ってな出力がUTF-8ででてるっぽいんだけど
これってEUC-JPに変更できないのかなあ。
ES3まではEUC-JPだったのに。
2006/03/09(木) 13:53:14ID:kx4zcmdN
199login:Penguin
2006/03/09(木) 15:10:08ID:LBUAWqfA 玄箱を Debian 化して、locale を utf8 にして、日本語manを入れたら、
euc-jp で書いてあって文字化け。orz
euc-jp で書いてあって文字化け。orz
2006/03/09(木) 18:00:07ID:kAtX1v8U
gentooの事例だけど
ttp://wiki.gentoo.gr.jp/index.php?%5B%5Btips%BD%B8%5D%5D#content_1_5
ttp://www.jaro68.org/needlejuice/blog/206
ttp://www.sen2or.com/index.php?itemid=1003
ttp://wiki.gentoo.gr.jp/index.php?%5B%5Btips%BD%B8%5D%5D#content_1_5
ttp://www.jaro68.org/needlejuice/blog/206
ttp://www.sen2or.com/index.php?itemid=1003
201login:Penguin
2006/03/12(日) 01:04:13ID:fe5y18+Z2006/03/12(日) 01:34:49ID:zOXA93u/
ファイルシステムにエンコーディングは関係あるし。
2006/03/12(日) 02:24:44ID:/fczP50N
>>202
どういう意味だろう?
とあるロケールで使用する文字コードが
ファイル名として使える文字コードの範囲内に入ってれば
何の問題も無いと思うんだが
例えばUTF-8のディストリでも、シコシコ設定書き直せば
システム全体の文字コードをEUCにもSJISにもできるわけで
どういう意味だろう?
とあるロケールで使用する文字コードが
ファイル名として使える文字コードの範囲内に入ってれば
何の問題も無いと思うんだが
例えばUTF-8のディストリでも、シコシコ設定書き直せば
システム全体の文字コードをEUCにもSJISにもできるわけで
2006/03/12(日) 02:51:32ID:Qy+1QTbg
205login:Penguin
2006/03/12(日) 03:56:15ID:K2J5B9uh >>204
NLSやcharsetはエンコードと関係あるが
カーネルがエンコードしている事の証明にはならないわけで^^;
「黙って」ほしいなら
「お願いですからこれ以上つっこまないでください」と懇願した上で
お前が黙れw
NLSやcharsetはエンコードと関係あるが
カーネルがエンコードしている事の証明にはならないわけで^^;
「黙って」ほしいなら
「お願いですからこれ以上つっこまないでください」と懇願した上で
お前が黙れw
2006/03/12(日) 04:11:48ID:Qy+1QTbg
つfs/nls/*.c, fs/*fs/*.c
2006/03/12(日) 04:38:25ID:zOXA93u/
2006/03/12(日) 12:48:03ID:/fczP50N
2006/03/12(日) 15:19:01ID:Oc3RTicA
たとえば'/'をディレクトリの区切りと見なしてるのは、ファイルシステム
だけじゃないと思うんだな。(思うだけでソース見て回ったわけじゃないが。)
とすると、8ビットクリーンな環境ならばファイル名がutf-8やeuc-jpは問題
ないが、iso-2022(-jp)やShift_JISを使うのには困る。
だけじゃないと思うんだな。(思うだけでソース見て回ったわけじゃないが。)
とすると、8ビットクリーンな環境ならばファイル名がutf-8やeuc-jpは問題
ないが、iso-2022(-jp)やShift_JISを使うのには困る。
2006/03/12(日) 18:10:19ID:MT19Gksr
>>209
禿同。
禿同。
211login:Penguin
2006/03/12(日) 20:27:33ID:ydqBlaR7 >>208
ん? iso-2022-jpを使ってファイルを取扱うシステムなんてあんの
ん? iso-2022-jpを使ってファイルを取扱うシステムなんてあんの
2006/03/13(月) 00:57:05ID:8cnv7aJ6
あらら極論を持ち出して・・・
2006/03/14(火) 15:01:37ID:ZJm9Ix4t
File system 自身が '/' という「文字」を抱え込んでるってのか?
2006/03/14(火) 16:59:18ID:XVd9AXqN
macでは':'
winでは'\'
winでは'\'
2006/03/14(火) 23:40:20ID:SOaD9AK3
まあ、/とか考えるまでもなく、ファイルシステムに文字エンコードは影響するし。
2006/03/15(水) 00:06:00ID:FTGcTosr
>>214
Windowsも内部的には'/'だよ
Windowsも内部的には'/'だよ
2006/03/15(水) 00:20:57ID:T9FwIHLt
あほ
2006/03/18(土) 14:10:06ID:007Os0Uq
>>216
あ、そなの?知らなかった。
あ、そなの?知らなかった。
2006/03/18(土) 16:17:10ID:akdUDpD2
>>216
ソース
ソース
2006/03/18(土) 17:46:45ID:KLdgQbg+
2006/03/18(土) 19:56:18ID:TivuVR12
システムコールがどちらも受け付けるからといって、
内部の扱いかどうかなんてわからんだろ。
ソースかバイナリを追った結果でもどこかにでてるんなら別だけど。
内部の扱いかどうかなんてわからんだろ。
ソースかバイナリを追った結果でもどこかにでてるんなら別だけど。
2006/03/18(土) 20:07:38ID:KLdgQbg+
おっと失礼。この一連の議論ね。
http://mail.python.org/pipermail/python-list/2003-September/185195.html
>>221
DOS2.11は/だったが、(ソースは見た)、今は全く違っていても不思議はないね。
http://mail.python.org/pipermail/python-list/2003-September/185195.html
>>221
DOS2.11は/だったが、(ソースは見た)、今は全く違っていても不思議はないね。
2006/03/18(土) 20:10:35ID:rRI0eBQC
>>222
もしかして、脳晦の容量不足している?
もしかして、脳晦の容量不足している?
2006/03/19(日) 00:37:05ID:wDljjOw3
JFSのunicodeってなに?
UCS4?
UCS4?
2006/03/19(日) 03:30:27ID:cmjBOE+n
無意味に煽ってる奴のほうがよっぽど顔悪く見える
2006/03/19(日) 13:45:56ID:zdRlaDhI
>>225
そうやって無意味に煽るのはやめなさい。
そうやって無意味に煽るのはやめなさい。
2006/03/19(日) 13:52:08ID:UpbZdusV
>>224
UCS2かUTF-16だとおもわれ。
UCS2かUTF-16だとおもわれ。
2006/03/21(火) 01:13:28ID:M+2sG4Eb
>>222
DOSは switcher を変えると / *も* 使えるようになるだけだ
DOSは switcher を変えると / *も* 使えるようになるだけだ
229login:Penguin
2006/03/23(木) 17:04:49ID:YW27Dazl 日本語はさ、1カラム文字と2カラム文字しかないけど
他の言語には3カラム文字とか4カラム文字とかあるの?
端末上で半角3文字分とか4文字分の文字。
他の言語には3カラム文字とか4カラム文字とかあるの?
端末上で半角3文字分とか4文字分の文字。
230login:Penguin
2006/03/23(木) 19:27:17ID:tr7Z4cN+2006/03/23(木) 19:28:31ID:tr7Z4cN+
はっ。しまった。あからさまな釣りか。
2006/03/23(木) 20:01:27ID:YW27Dazl
2006/03/23(木) 22:40:43ID:KIoq1Iks
unicode とそうでないので混じってるみたいだけど、
emacs の HELLO ファイルみると
(debian だと /usr/share/emacs/22.0.50/etc/HELLO)
Hindi とか Malayalam とか Kannada とかの
フォントセットのところに3とか4の文字がある。
emacs の HELLO ファイルみると
(debian だと /usr/share/emacs/22.0.50/etc/HELLO)
Hindi とか Malayalam とか Kannada とかの
フォントセットのところに3とか4の文字がある。
2006/03/23(木) 22:57:17ID:YW27Dazl
2006/03/24(金) 01:34:23ID:JGNnmuyn
unicodeって、リガチャがあるから面倒くさい。死ね。
2006/03/24(金) 17:08:59ID:u8A96IKS
>>234
アラビア文字みたいに横に伸びる文字なんじゃないかな。
日本語も実際には伸びる時がある(「おーーーーい」という
時の「ーーー」の部分とか)が、それを普通の文語体の文章
ではあまり使わないから困らないだけだ。
アラビア文字みたいに横に伸びる文字なんじゃないかな。
日本語も実際には伸びる時がある(「おーーーーい」という
時の「ーーー」の部分とか)が、それを普通の文語体の文章
ではあまり使わないから困らないだけだ。
2006/03/25(土) 00:18:32ID:J9uW1TTI
2006/03/25(土) 00:21:28ID:FjiAaDQS
各国語には対応できるけど多国語が微妙なんだよね。
2006/03/25(土) 03:07:23ID:IICSJlaQ
多国語でなくて多言語って言ってほしいかな。
2006/03/25(土) 10:25:48ID:7yPfObXQ
むはぁ
2006/04/29(土) 11:21:21ID:3FCe/A1k
2006/04/29(土) 21:33:35ID:N4s8B/kn
でさ、ファイルシステムにエンコーディングは関係あるの?
2006/05/07(日) 13:49:44ID:9szlYmVt
実運用上は、そんなエンコーディングの都合よりもftpdの文字化けで困るんだよね。
こればっかりはクライアント側の問題だからサーバ側ではどうにもならないし。
将来的にutf-8に統一されるなら今更eucJP使いたくないけど、
上記の理由で1台はeucJP確実なので、他も統一しないと使い勝手が悪い。
→全てeucjpで稼動。
こればっかりはクライアント側の問題だからサーバ側ではどうにもならないし。
将来的にutf-8に統一されるなら今更eucJP使いたくないけど、
上記の理由で1台はeucJP確実なので、他も統一しないと使い勝手が悪い。
→全てeucjpで稼動。
244login:Penguin
2006/05/08(月) 12:07:10ID:EWKIbwjX2006/05/08(月) 15:11:47ID:0ATCNism
>>243
ああ、あれで困ってEUC-JPに戻さざるを得なかった。(FTPサーバー立ててるから)
だって、UPされたファイルかたっぱしから文字化けして(LINUX上で)
何がなんだか分からんし。
そりゃ「日本語ファイルUPすんな!」って言えばいいんだけど、実際UPする人いるしな。
UP元のWindows機のファイルを全部英数字にリネームしろ! っていうのも横暴だし。
ああ、あれで困ってEUC-JPに戻さざるを得なかった。(FTPサーバー立ててるから)
だって、UPされたファイルかたっぱしから文字化けして(LINUX上で)
何がなんだか分からんし。
そりゃ「日本語ファイルUPすんな!」って言えばいいんだけど、実際UPする人いるしな。
UP元のWindows機のファイルを全部英数字にリネームしろ! っていうのも横暴だし。
2006/05/10(水) 12:05:03ID:PqdFQ5lv
eucjpなディレクトリツリーをsambaでローカルにのみ共有して
smbmountでiocharset=utf8でマウントして特定場所のみeucjpで
メインはutf8を共存みたいな
smbmountでiocharset=utf8でマウントして特定場所のみeucjpで
メインはutf8を共存みたいな
247login:Penguin
2006/05/10(水) 13:05:10ID:loEZm4Y3 そういや自宅では玄箱を utf8 にしてるな。
たまに Windows マシンから samba でアクセスするが、それは
ちゃんと設定してあってファイル名は玄箱側に utf8 で書かれる
ようになっている。通常は utf8 になっている Linux マシン
から nfs (autofs) で一部をマウントして使っている。
ftp ねえ。でも ftp を使ったとしても ftp クライアントが
utf8 のファイル名に対応してさえいればいいんだよね。
そういうのってまだないのかな?
たまに Windows マシンから samba でアクセスするが、それは
ちゃんと設定してあってファイル名は玄箱側に utf8 で書かれる
ようになっている。通常は utf8 になっている Linux マシン
から nfs (autofs) で一部をマウントして使っている。
ftp ねえ。でも ftp を使ったとしても ftp クライアントが
utf8 のファイル名に対応してさえいればいいんだよね。
そういうのってまだないのかな?
2006/05/10(水) 14:54:55ID:gPG0recc
8bitスルーなら問題ないでしょ。
readline使ったヤツとか。
readline使ったヤツとか。
2006/05/11(木) 04:59:01ID:iZnowODo
利用者側にftpクライアントを指定する時点で不合格じゃない?
250login:Penguin
2006/05/11(木) 14:17:34ID:tz1hDbmm2006/05/11(木) 21:20:12ID:MPosGOlv
素朴な疑問なんだけど、ある文字が何カラムになるかがロケールで決定できる
と考えるのがそもそもの間違いであって、TerminfoとかTermcapみたいな物に
そこら辺を全部面倒みて貰う方がすっきりするんじゃないの?
ここで言ってる文字幅って結局端末に依存する情報でしょ?
できるかどうかは知らんけど
と考えるのがそもそもの間違いであって、TerminfoとかTermcapみたいな物に
そこら辺を全部面倒みて貰う方がすっきりするんじゃないの?
ここで言ってる文字幅って結局端末に依存する情報でしょ?
できるかどうかは知らんけど
252login:Penguin
2006/05/11(木) 21:38:34ID:tz1hDbmm 文字幅? 一応 Unicode には Halfwidth と名前の付いた文字はあるけどな。
まあ、端末やプリンタで等幅の時に半分で出ることが期待された文字という
ことなんだろうが、こんな半角文字は早く消えて欲しいものだ。
まあ、端末やプリンタで等幅の時に半分で出ることが期待された文字という
ことなんだろうが、こんな半角文字は早く消えて欲しいものだ。
2006/05/11(木) 22:08:50ID:MPosGOlv
別にいわゆる半角文字に限らなくてもいいんでない?
端末によっては表示できない文字だってあるだろうし、それをどう扱うかは
端末が勝手に決めればいいんじゃないの?
結果として端末によっては、?で表示されたり、〓で表示されたり、\uXXXXで
エスケープして表示されたりするかもしれないけど、それって端末の勝手だよね?
最終的に端末で表示した時にズレなきゃそれでいいんだし、ロケールで面倒
みる必要はないと思うんだけどな。
まあ、代替文字として何が表示されてるか分からないと困る場合はあるかも
しれないから、そういう時は代替文字を端末データベースに問い合わせて
教えて貰えればそれで済むんじゃない?
なんかおかしな事言ってる?
端末によっては表示できない文字だってあるだろうし、それをどう扱うかは
端末が勝手に決めればいいんじゃないの?
結果として端末によっては、?で表示されたり、〓で表示されたり、\uXXXXで
エスケープして表示されたりするかもしれないけど、それって端末の勝手だよね?
最終的に端末で表示した時にズレなきゃそれでいいんだし、ロケールで面倒
みる必要はないと思うんだけどな。
まあ、代替文字として何が表示されてるか分からないと困る場合はあるかも
しれないから、そういう時は代替文字を端末データベースに問い合わせて
教えて貰えればそれで済むんじゃない?
なんかおかしな事言ってる?
2006/05/11(木) 22:26:09ID:gx3umMVs
Unicode Standard Annex #11
East Asian Width
http://www.unicode.org/unicode/reports/tr11/
Draft Unicode Technical Report #30
Character Foldings
http://unicode.org/reports/tr30/
East Asian Width
http://www.unicode.org/unicode/reports/tr11/
Draft Unicode Technical Report #30
Character Foldings
http://unicode.org/reports/tr30/
2006/05/11(木) 23:03:46ID:bYbMBCWq
合字があるから、面倒くさいんだよ。
2006/05/13(土) 03:27:14ID:0C6WASA7
>>216-222
内部を覗いて見ないと分からないけど、
Win32 API では、"\" が本則っぽいな。
ファイル名の先頭に \\?\ を付けると解釈が厳格になる。
その時、"/" を受けつけなくなる。
NTFS と VFAT はファイル名は UTF-16 で格納すると決まっていて、
API やカーネル内部も UTF-16 で統一されてるから、
その点では頭を抱えずに済んでる。
Debian の次期バージョンは UTF-8 らしいけど、どんな感じになるだろう。
UNICODE も弱点は多いけど他の良い手段が思い当たらないので、
UNICODE 自身の改良に期待するしかないと思っている。
内部を覗いて見ないと分からないけど、
Win32 API では、"\" が本則っぽいな。
ファイル名の先頭に \\?\ を付けると解釈が厳格になる。
その時、"/" を受けつけなくなる。
NTFS と VFAT はファイル名は UTF-16 で格納すると決まっていて、
API やカーネル内部も UTF-16 で統一されてるから、
その点では頭を抱えずに済んでる。
Debian の次期バージョンは UTF-8 らしいけど、どんな感じになるだろう。
UNICODE も弱点は多いけど他の良い手段が思い当たらないので、
UNICODE 自身の改良に期待するしかないと思っている。
2006/05/13(土) 21:44:08ID:S4JpwaCr
>>256 馬鹿発見
2006/05/17(水) 22:28:14ID:FZX45EoA
バックスラッシュと\が同じ文字コードだったとか
聞いた気がしたんだが…
勘違い?
聞いた気がしたんだが…
勘違い?
2006/05/17(水) 23:36:58ID:a4MJ+Tci
で?
2006/05/19(金) 01:06:49ID:ifty74/J
2006/05/19(金) 08:05:17ID:GW8la2YX
2006/05/19(金) 08:29:13ID:Kplndbt6
263login:Penguin
2006/05/22(月) 11:05:24ID:IgouP2VU 俺、今、Linux からおちゅ〜しゃでこのスレ見ているんだけど、
\ はバックスラッシュとして表示されます(円マークではない)。
その状態で読むとみんなして変な文章書いているように見える。w
\ はバックスラッシュとして表示されます(円マークではない)。
その状態で読むとみんなして変な文章書いているように見える。w
2006/05/22(月) 13:43:15ID:GrV5T77x
俺、今、英語版Windows からIEでこのスレ見ているんだけど、
\ はバックスラッシュとして表示されます(円マークではない)。
その状態で読むとみんなして変な文章書いているように見える。w
\ はバックスラッシュとして表示されます(円マークではない)。
その状態で読むとみんなして変な文章書いているように見える。w
2006/05/22(月) 23:15:37ID:PaXuCUI2
俺、今、(かん高い声で!)、navi2ch!
2006/05/23(火) 00:38:55ID:MNyc16BX
2006/05/23(火) 02:56:03ID:+D3NsWKB
>>266
区別していない?バックスラッシュとバックスラッシュは同じ文字なのに、どう区別するんだよ?
区別していない?バックスラッシュとバックスラッシュは同じ文字なのに、どう区別するんだよ?
2006/05/23(火) 07:50:38ID:YpTnBhhN
何がどういう風に問題なのかわからん。
2006/05/23(火) 08:14:43ID:sMe4PIZ0
SJISはともかく、EUC-JPも使い分けられないんだっけ?
ISO-2022-JPは問題ないよね。
ISO-2022-JPは問題ないよね。
2006/05/23(火) 09:31:32ID:YpTnBhhN
iso-2022-jp の半角部分は jis x 0201 だから、
\ は円マークだよ。
euc-jp は半角カナ以外の半角部分は ascii らしいので
\ はバックスラッシュだと思う。
\ は円マークだよ。
euc-jp は半角カナ以外の半角部分は ascii らしいので
\ はバックスラッシュだと思う。
2006/05/23(火) 10:13:01ID:s/6PQypJ
>>270
前半は嘘というかミスリーディングというか……、
ISO-2022-JPがASCIIを書けないとでも思ってんのかいな。
生半可な聞きかじりを垂れ流す前に考えるなり調べるなりしような。
Emacsで新しいファイルを作って、次の一行を入れて保存し開き直してみ。
\^[(J\^[(B
(^[はESCなのでEmacsだとC-q ESCで入力)
一つめはバックスラッシュに、二つめは円記号になるから。
前半は嘘というかミスリーディングというか……、
ISO-2022-JPがASCIIを書けないとでも思ってんのかいな。
生半可な聞きかじりを垂れ流す前に考えるなり調べるなりしような。
Emacsで新しいファイルを作って、次の一行を入れて保存し開き直してみ。
\^[(J\^[(B
(^[はESCなのでEmacsだとC-q ESCで入力)
一つめはバックスラッシュに、二つめは円記号になるから。
2006/05/23(火) 10:36:31ID:YpTnBhhN
すまん。
http://ja.wikipedia.org/wiki/ISO-2022-JP
ここに書いてなかったから勘違いしたよ。
http://www.ietf.org/rfc/rfc1468.txt
こっちみたらちゃんと ascii 入ってるわ。
http://ja.wikipedia.org/wiki/ISO-2022-JP
ここに書いてなかったから勘違いしたよ。
http://www.ietf.org/rfc/rfc1468.txt
こっちみたらちゃんと ascii 入ってるわ。
2006/05/23(火) 17:21:02ID:6e4Xj433
2006/05/23(火) 22:41:11ID:+D3NsWKB
>>272
「ISO646の国際基準版図形文字」って ASCII のことだろ?
「ISO646の国際基準版図形文字」って ASCII のことだろ?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【速報】星野真里(44) 24時間テレビのマラソンランナーに決定! [Ailuropoda melanoleuca★]
- 【芸能】松山千春、本田圭佑の解説に「なんで『さん』付けで呼ぶんだ?」「後輩なんだからさ」「つけない方がわかりやすいんじゃ…」 [冬月記者★]
- 【サッカーW杯】4-0 日本代表・森保ジャパン、チュニジアに歴史的4発大勝 アジア勢の1次L連敗を「6」で止めた★6 [ゴアマガラ★]
- 家族と来た水族館で…10代女性のスカート内を盗撮か 45歳の男を現行犯逮捕 静岡・下田市 [煮卵★]
- あぼーん
- 40歳男性・生活保護受給者 “グリ下のくすり屋さん”1つの医療機関から2万錠の薬を大量入手、「薬をめっちゃ売っていた」 [お断り★]
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★138【メキシコ/カナダ/アメリカ】
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★137【メキシコ/カナダ/アメリカ】
- はません
- ハム専 気合い入れなくて良いよ、もう
- かもめせん祝勝会
- 【D専】Part.7
- チ一牛の求愛行動ワロタwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
- 💳🤏( ・᷄ὢ・᷅ )俺のターン!ドロー!
- パスタを折るとイタリア人が怒るなら短いパスタを売ればいい
- ✋🏿( ・᷄ὢ・᷅ )寝るんで
- 🏡Monday✋😅✋揉んでー🏡
- Z世代「人生は親ガチャ!遺伝子ガチャで全部の運命は決まっている」👈これwwwwww [589647274]