Problem opisany w pytaniu występuje, gdy pusty/nowy dokument jest ustawiony na “ANSI”, a znaki Unicode są do niego wklejane.
Nie ma żadnego automatycznego wykrywania, gdy jest używany z pustym/nowym dokumentem, przynajmniej nie w wersji Notepad++, na której go testowałem (v5.4.5). “ANSI” jest domyślne w Notepad++ dla nowego dokumentu, chyba że ustawimy to w menu Settings → Preferences → zakładka New Document/Open Save Directory.
Rozwiązanie
Rozwiązaniem jest ustawienie kodowania na UTF-8 przed wklejeniem, menu Format → Koduj w UTF-8:
Przykład Skopiowałem jakiś tekst do nowego dokumentu Notepad++, Rosyjski (русский язык, russkiy yazyk), z Firefoxa wyświetlającego stronę Wikipedii język rosyjski _.
Jeżeli kodowanie jest nie zmienione z “ANSI”, to wynik jest następujący:
Jeżeli kodowanie jest zmienione, to wynik jest następujący:
Jak widać na poniższym rysunku (część cyrylica jest podświetlona), Notepad++ faktycznie konwertuje znaki Unicode na ASCII 63 (szesnastkowo 3F), znaki zapytania. Dlatego znaki Unicode są tracone (w trybie “ANSI”) podczas kopiowania tekstu przez schowek (to nie jest problem czcionki - informacja jest tracona).
Testowane na: Notepad++ v5.4.5 (UNICODE).