ja_JP.UTF-8
■ このスレッドは過去ログ倉庫に格納されています
1login:Penguin
04/02/19 17:09ID:EuXdEmYH Linux で ja_JP.UTF-8 ロケールで暮らす方法についてのスレです。
04/12/04 21:25:47ID:5ZS2CgHD
04/12/04 21:33:56ID:ziFkWoAh
サロゲートペア考えたやつは死刑
155login:Penguin
04/12/04 21:39:06ID:uTy9W2B7 >>154 うむ。あんな変なことするくらいなら、
素直に UCS4 で良かったのにな。
素直に UCS4 で良かったのにな。
156中の人
04/12/04 22:01:59ID:b+GZcVVR だって16bitで十分だと思ったんだもん…
157login:Penguin
04/12/04 22:16:44ID:6+KTXyp/ >>152
へーそうなんですか。曖昧な文字をすべて全角か半角か一方にすればとりあえず
困らないって感じですか?
実装をチェックしてみねば... どのみち、既存の wcswidth() を使ったら OK、という
ような単純なものではなさそうで。
全角半角問題に関しては、逆に CUI 系のプログラムから全角/半角という概念を
捨てきれればいいのかも。常に1文字1カラムで、ターミナルとかで既存の
挙動をしてほしかったらフォントのメトリックで対処すればいいとか。
(可変幅のカラムといいますか... アルファベットが等幅&日本語の文字幅がアル
ファベットの2倍にデザインされたフォントを使う)
って、これって問題をフォントのデザインに押し付けただけ?
あーでも、文字の表示を簡単に揃えたいときには結局固定幅のカラムじゃないと困る
ような気もしてきました。たとえば ls コマンドの表示ルーチンでフォントの
メトリックを計算させる必要があるとしたら (w
やっぱ Unicode がイカン、ということで。
へーそうなんですか。曖昧な文字をすべて全角か半角か一方にすればとりあえず
困らないって感じですか?
実装をチェックしてみねば... どのみち、既存の wcswidth() を使ったら OK、という
ような単純なものではなさそうで。
全角半角問題に関しては、逆に CUI 系のプログラムから全角/半角という概念を
捨てきれればいいのかも。常に1文字1カラムで、ターミナルとかで既存の
挙動をしてほしかったらフォントのメトリックで対処すればいいとか。
(可変幅のカラムといいますか... アルファベットが等幅&日本語の文字幅がアル
ファベットの2倍にデザインされたフォントを使う)
って、これって問題をフォントのデザインに押し付けただけ?
あーでも、文字の表示を簡単に揃えたいときには結局固定幅のカラムじゃないと困る
ような気もしてきました。たとえば ls コマンドの表示ルーチンでフォントの
メトリックを計算させる必要があるとしたら (w
やっぱ Unicode がイカン、ということで。
04/12/04 22:34:42ID:b+GZcVVR
>>157
> あーでも、文字の表示を簡単に揃えたいときには結局固定幅のカラムじゃないと困る
> ような気もしてきました。たとえば ls コマンドの表示ルーチンでフォントの
> メトリックを計算させる必要があるとしたら (w
mozillaのxmltermどうよ?
> あーでも、文字の表示を簡単に揃えたいときには結局固定幅のカラムじゃないと困る
> ような気もしてきました。たとえば ls コマンドの表示ルーチンでフォントの
> メトリックを計算させる必要があるとしたら (w
mozillaのxmltermどうよ?
04/12/04 22:40:54ID:6+KTXyp/
>>153
確かに。
で、とりあえず話を全角半角問題(?)に絞ると
wcwidth() が
1. 既存のエンコーディングを使うロケール (e.g ja_JP.eucJP)のときは、それらしく動く
(EUC-JP で2バイトな文字は全角、それ以外は半角 <- って、これも問題があるような)
2. Unicode を使うロケール( e.g. ja_JP.UTF-8) のときは
とりあえず EUC-JP -> UTF-8 にマッピングがある文字は 1. と同じ挙動。
ないものは、その他のロケールを探して(e.g. zh_CN.eucCN)、1. と同じような
判定ができればそれを採用。(できない場合は...)
みたいな挙動をしてくれたら、皆でそれを使えばいいような気がするんですが。。。
Ambiguous 云々というのは Unicode をベースに考えるからで、では既存のエンコーディング
をベースに考えると、こういうことになるのではないかと思いますが。。。
どのみち旧来の全角半角というのがあまり明快な考え方ではないので、決め方自体はすっきりしませんが、上のようにすれば、文字幅は地域コードのみに依存してエンコーディングに
は依存しないかなと。
確かに。
で、とりあえず話を全角半角問題(?)に絞ると
wcwidth() が
1. 既存のエンコーディングを使うロケール (e.g ja_JP.eucJP)のときは、それらしく動く
(EUC-JP で2バイトな文字は全角、それ以外は半角 <- って、これも問題があるような)
2. Unicode を使うロケール( e.g. ja_JP.UTF-8) のときは
とりあえず EUC-JP -> UTF-8 にマッピングがある文字は 1. と同じ挙動。
ないものは、その他のロケールを探して(e.g. zh_CN.eucCN)、1. と同じような
判定ができればそれを採用。(できない場合は...)
みたいな挙動をしてくれたら、皆でそれを使えばいいような気がするんですが。。。
Ambiguous 云々というのは Unicode をベースに考えるからで、では既存のエンコーディング
をベースに考えると、こういうことになるのではないかと思いますが。。。
どのみち旧来の全角半角というのがあまり明快な考え方ではないので、決め方自体はすっきりしませんが、上のようにすれば、文字幅は地域コードのみに依存してエンコーディングに
は依存しないかなと。
04/12/04 22:47:51ID:RHj7f47U
EUC-JPの半角カナは2バイトだよ・・・??
04/12/04 22:48:37ID:6+KTXyp/
>>158
>mozillaのxmltermどうよ?
う、使ったことないけど、もしかして表示の整列とかを賢くやってくれちゃうのかな?
いろいろ疑問がわくけど (ry とりあえず後で使ってみます。
眠くなったきたので休憩...
>mozillaのxmltermどうよ?
う、使ったことないけど、もしかして表示の整列とかを賢くやってくれちゃうのかな?
いろいろ疑問がわくけど (ry とりあえず後で使ってみます。
眠くなったきたので休憩...
04/12/04 22:54:15ID:5ZS2CgHD
04/12/04 22:57:36ID:b+GZcVVR
164login:Penguin
04/12/05 07:11:53ID:3PBNWURc Unicode 絡みの話題と言えば、最近 Mac OS X のバージョンが変わると特定の文字のコードが変わるとか言う話があったね。
http://slashdot.jp/article.pl?sid=04/11/30/1014219&topic=11&mode=nested
まぁドラフト段階の字形-コードの対応表を使っちゃった Apple が悪いんだけどさ。
ところで、「字形-コードの対応表」って専門用語ではなんて言うの?
http://slashdot.jp/article.pl?sid=04/11/30/1014219&topic=11&mode=nested
まぁドラフト段階の字形-コードの対応表を使っちゃった Apple が悪いんだけどさ。
ところで、「字形-コードの対応表」って専門用語ではなんて言うの?
04/12/05 11:35:33ID:U+jxCrh2
Coded Character Set
04/12/05 12:27:30ID:3PBNWURc
>>165 符号化文字集合…か。
04/12/05 22:36:47ID:U+jxCrh2
>Coded Character Set(CCS)
説明不足だった。これは文字毎に一意の番号を振ってある文字集合。
JIS X 0208とか、UCS-2とかがそれ。
CCSをどういうバイト列で表すかがCharacter Encoding Scheme(CES)。
EUC-JPとかUTF-8とかがそれ。
ただ、字形じゃなくて文字概念に番号がついてるから、どっちも
厳密には>>164の言ってるものじゃないのかも。
AdobeのCIDは字形に番号が振ってあるな。
説明不足だった。これは文字毎に一意の番号を振ってある文字集合。
JIS X 0208とか、UCS-2とかがそれ。
CCSをどういうバイト列で表すかがCharacter Encoding Scheme(CES)。
EUC-JPとかUTF-8とかがそれ。
ただ、字形じゃなくて文字概念に番号がついてるから、どっちも
厳密には>>164の言ってるものじゃないのかも。
AdobeのCIDは字形に番号が振ってあるな。
04/12/15 17:38:23ID:CmtNvJ+T
xmlterm、まだ使ってないけどスクリーンショットでそのコンセプトはわかった
気がする。ターミナルを一種のブラウザと考えるとああなるのかな。
今までのターミナルはプレーンテキスト専用のブラウザとも言える訳だ。
こうなったら、ウェブブラウザもファイルブラウザもターミナルも
全部統合した UI を目指す事にします。ってどこかで見た気が...
気がする。ターミナルを一種のブラウザと考えるとああなるのかな。
今までのターミナルはプレーンテキスト専用のブラウザとも言える訳だ。
こうなったら、ウェブブラウザもファイルブラウザもターミナルも
全部統合した UI を目指す事にします。ってどこかで見た気が...
04/12/15 20:35:16ID:AiVgzkM7
餅は餅屋ということわざを教えてあげたい
04/12/15 23:06:31ID:pwu6u1JE
和菓子屋の餅も旨いよ。
04/12/15 23:18:48ID:v6Owr1lz
佐藤の切り餅って超まずいね。というか餅じゃない。
あんな餅を餅だと思って食べている人がいるかと思うと
かわいそうだ。
あんな餅を餅だと思って食べている人がいるかと思うと
かわいそうだ。
04/12/29 01:17:45ID:3YiZNVoJ
173login:Penguin
05/01/18 15:41:07ID:Wb3X1dyN05/02/26 04:56:11ID:OxqQlLig
Mac OS X,で使われているUTF-8 with NFDを扱おうとおもって、
http://www.opensource.apple.com/darwinsource/10.3.8/
からAppleハック済みのlibiconvをx86のlinuxでコンパイルしてみました。
configureもmakeも問題なくできるのだけれども、iconv -f UTF-8-MAC -t UTF-8 等としてもどうもうまく動かないんです。
(Mac OS Xでコンパイルすると問題なく動きます。)
どうもエンディアンの問題臭いのですが、自力では解決できず...
netatalkのUTF-8 with NFDの実装が一番上手な気がするのですが、そこからもってくるのは難しいので困っています。
どなたかNFDからComposed Formに変換する方法をご存知の方はいらっしゃいますか?
http://www.opensource.apple.com/darwinsource/10.3.8/
からAppleハック済みのlibiconvをx86のlinuxでコンパイルしてみました。
configureもmakeも問題なくできるのだけれども、iconv -f UTF-8-MAC -t UTF-8 等としてもどうもうまく動かないんです。
(Mac OS Xでコンパイルすると問題なく動きます。)
どうもエンディアンの問題臭いのですが、自力では解決できず...
netatalkのUTF-8 with NFDの実装が一番上手な気がするのですが、そこからもってくるのは難しいので困っています。
どなたかNFDからComposed Formに変換する方法をご存知の方はいらっしゃいますか?
05/03/07 02:10:29ID:233WSAJL
なんで UTF-8 の変換にエンディアンが関係するんdayo!
って一瞬思ったけど、iconv の内部的には一旦 UTF-16 とかにしてるのかな?
Apple のハックのせいなんなら普通の libiconv と比較してみたらいいんじゃねーの?
それか普通の libiconv にその UTF-8-MAC を追加する方向で修正してみるとか
...ってのができないわけね。
Mac OS X が使えるなら Mac OS X 上で変換してから他のプラットフォームに持って
いくんじゃ駄目なのか?
って一瞬思ったけど、iconv の内部的には一旦 UTF-16 とかにしてるのかな?
Apple のハックのせいなんなら普通の libiconv と比較してみたらいいんじゃねーの?
それか普通の libiconv にその UTF-8-MAC を追加する方向で修正してみるとか
...ってのができないわけね。
Mac OS X が使えるなら Mac OS X 上で変換してから他のプラットフォームに持って
いくんじゃ駄目なのか?
05/03/07 12:53:14ID:v/gznSFy
05/03/08 12:02:39ID:FpUM9LjU
ja_JP.UTF-8 ロケールでeuc-jpのnfs鯖をマウントするときみんなどうやってるの?
(sambaや、webdav使えばできるんだけどネ、nfsでの解決策を教えてね)
(sambaや、webdav使えばできるんだけどネ、nfsでの解決策を教えてね)
178175
05/03/08 12:30:30ID:p+KoiNpg 問題が本当にエンディアンのせいなら、utf8mac_mbtowc() が呼んでいる
utf8_decodestr() の引数に UTF_REVERSE_ENDIAN をセットしてみたらいいかも。
ハードコーディングになっちゃうけど。
それで駄目だったら >>176 の回答待ちか。
utf8_decodestr() の引数に UTF_REVERSE_ENDIAN をセットしてみたらいいかも。
ハードコーディングになっちゃうけど。
それで駄目だったら >>176 の回答待ちか。
179174
05/03/10 00:01:21ID:AGM4jA9o >>176
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-9.tar.gz
をダウンロードして、
./configure --enable-static=yes --enable-shared=no --disable-nls --prefix=/opt/mac
としてconfigureしてmakeして、スタティックリンクしたバイナリを作って実験してみました。
ls | iconv -f UTF-8-MAC -t UTF-8
で、NKDな文字がちゃんと出てくるか調べてみたのですが、めちゃくちゃな文字化けしか起こりませんでした…
>>178
UTF_REVERSE_ENDIANをセットしてみてもしなくてもですが、めちゃくちゃに文字が化けてしまいました。
一つ怪しいかなと思うのが、
utf8mac.h: In function `utf8mac_mbtowc':
utf8mac.h:1566: warning: passing arg 6 of `utf8_decodestr' makes integer from pointer without a cast
なんてwarningがでるんですが、もしかしてこれのせいでPowerPCでしか動かないコードになっていることなんです。
でもCが全くわからないので意味はわからないのですが…
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-9.tar.gz
をダウンロードして、
./configure --enable-static=yes --enable-shared=no --disable-nls --prefix=/opt/mac
としてconfigureしてmakeして、スタティックリンクしたバイナリを作って実験してみました。
ls | iconv -f UTF-8-MAC -t UTF-8
で、NKDな文字がちゃんと出てくるか調べてみたのですが、めちゃくちゃな文字化けしか起こりませんでした…
>>178
UTF_REVERSE_ENDIANをセットしてみてもしなくてもですが、めちゃくちゃに文字が化けてしまいました。
一つ怪しいかなと思うのが、
utf8mac.h: In function `utf8mac_mbtowc':
utf8mac.h:1566: warning: passing arg 6 of `utf8_decodestr' makes integer from pointer without a cast
なんてwarningがでるんですが、もしかしてこれのせいでPowerPCでしか動かないコードになっていることなんです。
でもCが全くわからないので意味はわからないのですが…
2005/06/06(月) 13:22:58ID:1kxaCCcu
>>179
気になったので試してみたけど、
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-10.tar.gz
や
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-13.tar.gz
なら
-#include <libkern/OSByteOrder.h>
+//#include <libkern/OSByteOrder.h>
+#include <byteswap.h>
+#define OSSwapInt16(x) bswap_16(x)
+#define __LITTLE_ENDIAN__
という変更でいけるみたい。
気になったので試してみたけど、
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-10.tar.gz
や
http://www.opensource.apple.com/darwinsource/tarballs/other/libiconv-13.tar.gz
なら
-#include <libkern/OSByteOrder.h>
+//#include <libkern/OSByteOrder.h>
+#include <byteswap.h>
+#define OSSwapInt16(x) bswap_16(x)
+#define __LITTLE_ENDIAN__
という変更でいけるみたい。
181naruse
2005/07/07(木) 20:26:04ID:Ajp7X6MQ nkfの最新のCVS版で、
nkf -w --utf8mac-input hoge.txt
などとすればUTF-8-MACをUTF-8に変換できる・・・はずです。
うまくいかない場合は教えてください。
nkf -w --utf8mac-input hoge.txt
などとすればUTF-8-MACをUTF-8に変換できる・・・はずです。
うまくいかない場合は教えてください。
182login:Penguin
2005/07/13(水) 03:15:25ID:GiU0rXXK183login:Penguin
2006/01/10(火) 14:40:21ID:s0uQ10WF あけおめage
184login:Penguin
2006/01/18(水) 17:33:51ID:1b8YR8q0 フェどらって、OSの仕様をかえればすぐにソフトの仕様もかわると思ったのかな?
2006/01/21(土) 16:33:52ID:e7e/lB8H
「すぐに」とは思ってないんじゃない。
2006/02/01(水) 08:31:41ID:H6kL8c39
使っているOSがUTF-8なのかEUC-JPなのか
簡単に判別する方法はあるでしょうか?
とりあえず、今1CDのGeeXboXを日本語対応化してみていますが
USBメモリー(vfat)上のファイル名は正常に表示されますが
HDD上のファイルがうまくいっていません。
たぶん、このHDDへのファイル保存をVineでやっているので
未だEUC-JPのVineだってところか
あるいはGeeXboX側のmount optionの問題か…手詰り。
UTF-8標準に向かったディストリビューションには
ファイル名をUTF-8化するコマンドがあるようですが
とりあえず、Vineではapt-getはできないようで…
いっそ、UTF-8標準のディストリビューションを入れちゃうか?と思ったり。
それとも、FedoraCoreからconvmvのソースとってくるほうが速いのか?
どちらにしろ、もう遅刻する時間を過ぎているので出勤しまつ orz
ちなみに、GeeXboXはlibsmbなんとかやfstabが
ラムディスクイメージの中にあるので、今私には手が出せません。
#気の迷いでパソコン一般板にGeeXboXスレ立て公開中
簡単に判別する方法はあるでしょうか?
とりあえず、今1CDのGeeXboXを日本語対応化してみていますが
USBメモリー(vfat)上のファイル名は正常に表示されますが
HDD上のファイルがうまくいっていません。
たぶん、このHDDへのファイル保存をVineでやっているので
未だEUC-JPのVineだってところか
あるいはGeeXboX側のmount optionの問題か…手詰り。
UTF-8標準に向かったディストリビューションには
ファイル名をUTF-8化するコマンドがあるようですが
とりあえず、Vineではapt-getはできないようで…
いっそ、UTF-8標準のディストリビューションを入れちゃうか?と思ったり。
それとも、FedoraCoreからconvmvのソースとってくるほうが速いのか?
どちらにしろ、もう遅刻する時間を過ぎているので出勤しまつ orz
ちなみに、GeeXboXはlibsmbなんとかやfstabが
ラムディスクイメージの中にあるので、今私には手が出せません。
#気の迷いでパソコン一般板にGeeXboXスレ立て公開中
187login:Penguin
2006/02/01(水) 10:57:17ID:5OoK6VSB age
OS が UTF-8 ってのは
UTF-8 対応のロケールが入っているかどうか?という意味なんでしょうかね。
OS が UTF-8 ってのは
UTF-8 対応のロケールが入っているかどうか?という意味なんでしょうかね。
188login:Penguin
2006/02/01(水) 11:00:41ID:fQfoX2Vz >>187
だね。kernelはutf-8対応なんかしちゃいないよ。
だね。kernelはutf-8対応なんかしちゃいないよ。
189login:Penguin
2006/02/01(水) 13:51:37ID:IyxnkmjE >>188
ん?VFATとかsmbfsなどのNLSにUTF-8が入ってるけど?
他のUTF-8/16なOSとファイルレベルで互換とらないといけないFilesystemはカーネルレベルでNLSサポートしてますよん。
ん?VFATとかsmbfsなどのNLSにUTF-8が入ってるけど?
他のUTF-8/16なOSとファイルレベルで互換とらないといけないFilesystemはカーネルレベルでNLSサポートしてますよん。
190login:Penguin
2006/02/01(水) 15:11:08ID:fQfoX2Vz それドライバの話でしょ。カーネルからはNUL端の文字列にすぎないよ。
2006/02/01(水) 16:05:56ID:qAxvh4Kn
ドライバがカーネルかどうかなんでどうでもいいから
2006/02/01(水) 18:36:18ID:/PUwsy/N
カーネルをソースからコンパイルするときに
ファイルシステムのエンコーディングを
UTF-8だのSJISだのEUCだの指定できるのはなんなんだろうね。
ファイルシステムのエンコーディングを
UTF-8だのSJISだのEUCだの指定できるのはなんなんだろうね。
2006/02/01(水) 21:30:09ID:/ik9G5r3
194login:Penguin
2006/02/01(水) 22:51:36ID:axKot8bp EUCで書かれたシェルスクリプトをUTF-8でごちゃごちゃいじって、
おなじファイルなのに容量が増えることに愕然としたりして、
それでもいじってとりあえず動くものができたんですが、
日本語の文字化け以外にはやう゛ぁイことって何も無いですよね?
おなじファイルなのに容量が増えることに愕然としたりして、
それでもいじってとりあえず動くものができたんですが、
日本語の文字化け以外にはやう゛ぁイことって何も無いですよね?
2006/02/02(木) 09:08:46ID:Gkp5Be+f
おまえ
196186
2006/02/02(木) 21:37:38ID:I2B8ecnQ とりあえず、LOCALEの設定箇所を調べて
そこを確認すればわかるってことでいいようですね。
それはそうと、アクセス規制の一日の間に
convmvでUTF-8ファイル名にしたら当座の目的は解決。
ともかく、ありがとうございました。
そこを確認すればわかるってことでいいようですね。
それはそうと、アクセス規制の一日の間に
convmvでUTF-8ファイル名にしたら当座の目的は解決。
ともかく、ありがとうございました。
197login:Penguin
2006/03/09(木) 13:51:20ID:Bujq6YPa はじめてRedHatES4いれてみた。
# /etc/init.d/xinetd reload
繹・秧莨若榛 [ OK ]
ってな出力がUTF-8ででてるっぽいんだけど
これってEUC-JPに変更できないのかなあ。
ES3まではEUC-JPだったのに。
# /etc/init.d/xinetd reload
繹・秧莨若榛 [ OK ]
ってな出力がUTF-8ででてるっぽいんだけど
これってEUC-JPに変更できないのかなあ。
ES3まではEUC-JPだったのに。
2006/03/09(木) 13:53:14ID:kx4zcmdN
199login:Penguin
2006/03/09(木) 15:10:08ID:LBUAWqfA 玄箱を Debian 化して、locale を utf8 にして、日本語manを入れたら、
euc-jp で書いてあって文字化け。orz
euc-jp で書いてあって文字化け。orz
2006/03/09(木) 18:00:07ID:kAtX1v8U
gentooの事例だけど
ttp://wiki.gentoo.gr.jp/index.php?%5B%5Btips%BD%B8%5D%5D#content_1_5
ttp://www.jaro68.org/needlejuice/blog/206
ttp://www.sen2or.com/index.php?itemid=1003
ttp://wiki.gentoo.gr.jp/index.php?%5B%5Btips%BD%B8%5D%5D#content_1_5
ttp://www.jaro68.org/needlejuice/blog/206
ttp://www.sen2or.com/index.php?itemid=1003
201login:Penguin
2006/03/12(日) 01:04:13ID:fe5y18+Z2006/03/12(日) 01:34:49ID:zOXA93u/
ファイルシステムにエンコーディングは関係あるし。
2006/03/12(日) 02:24:44ID:/fczP50N
>>202
どういう意味だろう?
とあるロケールで使用する文字コードが
ファイル名として使える文字コードの範囲内に入ってれば
何の問題も無いと思うんだが
例えばUTF-8のディストリでも、シコシコ設定書き直せば
システム全体の文字コードをEUCにもSJISにもできるわけで
どういう意味だろう?
とあるロケールで使用する文字コードが
ファイル名として使える文字コードの範囲内に入ってれば
何の問題も無いと思うんだが
例えばUTF-8のディストリでも、シコシコ設定書き直せば
システム全体の文字コードをEUCにもSJISにもできるわけで
2006/03/12(日) 02:51:32ID:Qy+1QTbg
205login:Penguin
2006/03/12(日) 03:56:15ID:K2J5B9uh >>204
NLSやcharsetはエンコードと関係あるが
カーネルがエンコードしている事の証明にはならないわけで^^;
「黙って」ほしいなら
「お願いですからこれ以上つっこまないでください」と懇願した上で
お前が黙れw
NLSやcharsetはエンコードと関係あるが
カーネルがエンコードしている事の証明にはならないわけで^^;
「黙って」ほしいなら
「お願いですからこれ以上つっこまないでください」と懇願した上で
お前が黙れw
2006/03/12(日) 04:11:48ID:Qy+1QTbg
つfs/nls/*.c, fs/*fs/*.c
2006/03/12(日) 04:38:25ID:zOXA93u/
2006/03/12(日) 12:48:03ID:/fczP50N
2006/03/12(日) 15:19:01ID:Oc3RTicA
たとえば'/'をディレクトリの区切りと見なしてるのは、ファイルシステム
だけじゃないと思うんだな。(思うだけでソース見て回ったわけじゃないが。)
とすると、8ビットクリーンな環境ならばファイル名がutf-8やeuc-jpは問題
ないが、iso-2022(-jp)やShift_JISを使うのには困る。
だけじゃないと思うんだな。(思うだけでソース見て回ったわけじゃないが。)
とすると、8ビットクリーンな環境ならばファイル名がutf-8やeuc-jpは問題
ないが、iso-2022(-jp)やShift_JISを使うのには困る。
2006/03/12(日) 18:10:19ID:MT19Gksr
>>209
禿同。
禿同。
211login:Penguin
2006/03/12(日) 20:27:33ID:ydqBlaR7 >>208
ん? iso-2022-jpを使ってファイルを取扱うシステムなんてあんの
ん? iso-2022-jpを使ってファイルを取扱うシステムなんてあんの
2006/03/13(月) 00:57:05ID:8cnv7aJ6
あらら極論を持ち出して・・・
2006/03/14(火) 15:01:37ID:ZJm9Ix4t
File system 自身が '/' という「文字」を抱え込んでるってのか?
2006/03/14(火) 16:59:18ID:XVd9AXqN
macでは':'
winでは'\'
winでは'\'
2006/03/14(火) 23:40:20ID:SOaD9AK3
まあ、/とか考えるまでもなく、ファイルシステムに文字エンコードは影響するし。
2006/03/15(水) 00:06:00ID:FTGcTosr
>>214
Windowsも内部的には'/'だよ
Windowsも内部的には'/'だよ
2006/03/15(水) 00:20:57ID:T9FwIHLt
あほ
2006/03/18(土) 14:10:06ID:007Os0Uq
>>216
あ、そなの?知らなかった。
あ、そなの?知らなかった。
2006/03/18(土) 16:17:10ID:akdUDpD2
>>216
ソース
ソース
2006/03/18(土) 17:46:45ID:KLdgQbg+
2006/03/18(土) 19:56:18ID:TivuVR12
システムコールがどちらも受け付けるからといって、
内部の扱いかどうかなんてわからんだろ。
ソースかバイナリを追った結果でもどこかにでてるんなら別だけど。
内部の扱いかどうかなんてわからんだろ。
ソースかバイナリを追った結果でもどこかにでてるんなら別だけど。
2006/03/18(土) 20:07:38ID:KLdgQbg+
おっと失礼。この一連の議論ね。
http://mail.python.org/pipermail/python-list/2003-September/185195.html
>>221
DOS2.11は/だったが、(ソースは見た)、今は全く違っていても不思議はないね。
http://mail.python.org/pipermail/python-list/2003-September/185195.html
>>221
DOS2.11は/だったが、(ソースは見た)、今は全く違っていても不思議はないね。
2006/03/18(土) 20:10:35ID:rRI0eBQC
>>222
もしかして、脳晦の容量不足している?
もしかして、脳晦の容量不足している?
2006/03/19(日) 00:37:05ID:wDljjOw3
JFSのunicodeってなに?
UCS4?
UCS4?
2006/03/19(日) 03:30:27ID:cmjBOE+n
無意味に煽ってる奴のほうがよっぽど顔悪く見える
2006/03/19(日) 13:45:56ID:zdRlaDhI
>>225
そうやって無意味に煽るのはやめなさい。
そうやって無意味に煽るのはやめなさい。
2006/03/19(日) 13:52:08ID:UpbZdusV
>>224
UCS2かUTF-16だとおもわれ。
UCS2かUTF-16だとおもわれ。
2006/03/21(火) 01:13:28ID:M+2sG4Eb
>>222
DOSは switcher を変えると / *も* 使えるようになるだけだ
DOSは switcher を変えると / *も* 使えるようになるだけだ
229login:Penguin
2006/03/23(木) 17:04:49ID:YW27Dazl 日本語はさ、1カラム文字と2カラム文字しかないけど
他の言語には3カラム文字とか4カラム文字とかあるの?
端末上で半角3文字分とか4文字分の文字。
他の言語には3カラム文字とか4カラム文字とかあるの?
端末上で半角3文字分とか4文字分の文字。
230login:Penguin
2006/03/23(木) 19:27:17ID:tr7Z4cN+2006/03/23(木) 19:28:31ID:tr7Z4cN+
はっ。しまった。あからさまな釣りか。
2006/03/23(木) 20:01:27ID:YW27Dazl
2006/03/23(木) 22:40:43ID:KIoq1Iks
unicode とそうでないので混じってるみたいだけど、
emacs の HELLO ファイルみると
(debian だと /usr/share/emacs/22.0.50/etc/HELLO)
Hindi とか Malayalam とか Kannada とかの
フォントセットのところに3とか4の文字がある。
emacs の HELLO ファイルみると
(debian だと /usr/share/emacs/22.0.50/etc/HELLO)
Hindi とか Malayalam とか Kannada とかの
フォントセットのところに3とか4の文字がある。
2006/03/23(木) 22:57:17ID:YW27Dazl
2006/03/24(金) 01:34:23ID:JGNnmuyn
unicodeって、リガチャがあるから面倒くさい。死ね。
2006/03/24(金) 17:08:59ID:u8A96IKS
>>234
アラビア文字みたいに横に伸びる文字なんじゃないかな。
日本語も実際には伸びる時がある(「おーーーーい」という
時の「ーーー」の部分とか)が、それを普通の文語体の文章
ではあまり使わないから困らないだけだ。
アラビア文字みたいに横に伸びる文字なんじゃないかな。
日本語も実際には伸びる時がある(「おーーーーい」という
時の「ーーー」の部分とか)が、それを普通の文語体の文章
ではあまり使わないから困らないだけだ。
2006/03/25(土) 00:18:32ID:J9uW1TTI
2006/03/25(土) 00:21:28ID:FjiAaDQS
各国語には対応できるけど多国語が微妙なんだよね。
2006/03/25(土) 03:07:23ID:IICSJlaQ
多国語でなくて多言語って言ってほしいかな。
2006/03/25(土) 10:25:48ID:7yPfObXQ
むはぁ
2006/04/29(土) 11:21:21ID:3FCe/A1k
2006/04/29(土) 21:33:35ID:N4s8B/kn
でさ、ファイルシステムにエンコーディングは関係あるの?
2006/05/07(日) 13:49:44ID:9szlYmVt
実運用上は、そんなエンコーディングの都合よりもftpdの文字化けで困るんだよね。
こればっかりはクライアント側の問題だからサーバ側ではどうにもならないし。
将来的にutf-8に統一されるなら今更eucJP使いたくないけど、
上記の理由で1台はeucJP確実なので、他も統一しないと使い勝手が悪い。
→全てeucjpで稼動。
こればっかりはクライアント側の問題だからサーバ側ではどうにもならないし。
将来的にutf-8に統一されるなら今更eucJP使いたくないけど、
上記の理由で1台はeucJP確実なので、他も統一しないと使い勝手が悪い。
→全てeucjpで稼動。
244login:Penguin
2006/05/08(月) 12:07:10ID:EWKIbwjX2006/05/08(月) 15:11:47ID:0ATCNism
>>243
ああ、あれで困ってEUC-JPに戻さざるを得なかった。(FTPサーバー立ててるから)
だって、UPされたファイルかたっぱしから文字化けして(LINUX上で)
何がなんだか分からんし。
そりゃ「日本語ファイルUPすんな!」って言えばいいんだけど、実際UPする人いるしな。
UP元のWindows機のファイルを全部英数字にリネームしろ! っていうのも横暴だし。
ああ、あれで困ってEUC-JPに戻さざるを得なかった。(FTPサーバー立ててるから)
だって、UPされたファイルかたっぱしから文字化けして(LINUX上で)
何がなんだか分からんし。
そりゃ「日本語ファイルUPすんな!」って言えばいいんだけど、実際UPする人いるしな。
UP元のWindows機のファイルを全部英数字にリネームしろ! っていうのも横暴だし。
2006/05/10(水) 12:05:03ID:PqdFQ5lv
eucjpなディレクトリツリーをsambaでローカルにのみ共有して
smbmountでiocharset=utf8でマウントして特定場所のみeucjpで
メインはutf8を共存みたいな
smbmountでiocharset=utf8でマウントして特定場所のみeucjpで
メインはutf8を共存みたいな
247login:Penguin
2006/05/10(水) 13:05:10ID:loEZm4Y3 そういや自宅では玄箱を utf8 にしてるな。
たまに Windows マシンから samba でアクセスするが、それは
ちゃんと設定してあってファイル名は玄箱側に utf8 で書かれる
ようになっている。通常は utf8 になっている Linux マシン
から nfs (autofs) で一部をマウントして使っている。
ftp ねえ。でも ftp を使ったとしても ftp クライアントが
utf8 のファイル名に対応してさえいればいいんだよね。
そういうのってまだないのかな?
たまに Windows マシンから samba でアクセスするが、それは
ちゃんと設定してあってファイル名は玄箱側に utf8 で書かれる
ようになっている。通常は utf8 になっている Linux マシン
から nfs (autofs) で一部をマウントして使っている。
ftp ねえ。でも ftp を使ったとしても ftp クライアントが
utf8 のファイル名に対応してさえいればいいんだよね。
そういうのってまだないのかな?
2006/05/10(水) 14:54:55ID:gPG0recc
8bitスルーなら問題ないでしょ。
readline使ったヤツとか。
readline使ったヤツとか。
2006/05/11(木) 04:59:01ID:iZnowODo
利用者側にftpクライアントを指定する時点で不合格じゃない?
250login:Penguin
2006/05/11(木) 14:17:34ID:tz1hDbmm2006/05/11(木) 21:20:12ID:MPosGOlv
素朴な疑問なんだけど、ある文字が何カラムになるかがロケールで決定できる
と考えるのがそもそもの間違いであって、TerminfoとかTermcapみたいな物に
そこら辺を全部面倒みて貰う方がすっきりするんじゃないの?
ここで言ってる文字幅って結局端末に依存する情報でしょ?
できるかどうかは知らんけど
と考えるのがそもそもの間違いであって、TerminfoとかTermcapみたいな物に
そこら辺を全部面倒みて貰う方がすっきりするんじゃないの?
ここで言ってる文字幅って結局端末に依存する情報でしょ?
できるかどうかは知らんけど
252login:Penguin
2006/05/11(木) 21:38:34ID:tz1hDbmm 文字幅? 一応 Unicode には Halfwidth と名前の付いた文字はあるけどな。
まあ、端末やプリンタで等幅の時に半分で出ることが期待された文字という
ことなんだろうが、こんな半角文字は早く消えて欲しいものだ。
まあ、端末やプリンタで等幅の時に半分で出ることが期待された文字という
ことなんだろうが、こんな半角文字は早く消えて欲しいものだ。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- アルバイト女性(30)と小学生女児(10) 練炭が置かれた車内で発見される ★2 [お断り★]
- 【父の日】水族館でカワウソの水槽を見ていた10代女性のスカート内を盗撮か 40代の自称会社員の男を現行犯逮捕=静岡・下田市 [nita★]
- 【W杯】ベルギー、イランとも2試合連続のドロー! ベルギーが後半に退場者もイランは攻め切れず/ベルギー 0-0 イラン [征夷大将軍★]
- 【芸能】松山千春、本田圭佑の解説に「なんで『さん』付けで呼ぶんだ?」「後輩なんだからさ」「つけない方がわかりやすいんじゃ…」 [冬月記者★]
- 【速報】星野真里(44) 24時間テレビのマラソンランナーに決定! ★2 [Ailuropoda melanoleuca★]
- 【サッカーW杯】4-0 日本代表・森保ジャパン、チュニジアに歴史的4発大勝 アジア勢の1次L連敗を「6」で止めた★6 [ゴアマガラ★]
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★139【メキシコ/カナダ/アメリカ】
- 2026/06/21(日) 21:18:50.88 ID:F2HvoAZ4<> <a href="../test/read.cgi/livebase/1782042743/353" rel="noopener noreferrer" target="_blank">>>353</a> <br> 交流戦後半から勝った印象ないもんw <>
- 2026 MotoGP Lap38【チェコGP】
- こいせん祝勝会 全レス転載禁止
- わしせん3
- ハム専 気合い入れなくて良いよ、もう
- 【高市悲報】トランプが暴言「お前らはあのクソみたいな国にすら戻れなくなる、残りの国土は我々が乗っ取る、奴らをぶっ潰してやる [733893279]
- 【動画】日本代表応援団の日本人さん、現地ピックアップトラックに乗り込み馬鹿騒ぎしてしまうwwwwwwwwwwww [668024367]
- イコラブ見てる男の子wwwwwwwwww
- 日本人、資源が回復してきたので、クロマグロ大型魚の漁獲枠、来年以降「25%拡大」提案😲 [521921834]
- すじまんこにクレジットカードを通すと
- ぺこーらと一緒にサッカー見てた