<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Menlo-Regular;
        panose-1:0 0 0 0 0 0 0 0 0 0;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
span.m-3701973514068415065apple-converted-space
        {mso-style-name:m_-3701973514068415065apple-converted-space;}
span.EmailStyle19
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.EmailStyle20
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">I don’t think the file you attached is UTF8.  I have a number of tools I use to identify encoding, and it looks like ANSI to me.  I can save it as UTF8 and the diacritics for
 display, don’t change, but the underlying code values most certainly do.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">For example – you your CSV file – the following data:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">New Riverside CafŽ<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">At a binary level, the diacritic is represented as: 0x8e 0x2c<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">As a UTF8 file, that same diacritic would be represented as:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">0xc5 0xbd<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">--tr<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">From:</span></b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> archivesspace_users_group-bounces@lyralists.lyrasis.org [mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org]
<b>On Behalf Of </b>Lisa Calahan<br>
<b>Sent:</b> Wednesday, February 15, 2017 4:26 PM<br>
<b>To:</b> Archivesspace Users Group <archivesspace_users_group@lyralists.lyrasis.org><br>
<b>Subject:</b> Re: [Archivesspace_Users_Group] Enumerations Findings<o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal">I've attached the .csv example. I didn't test it in 1.5.3, but the bug occurs in 1.5.2 (I know it did not occur in 1.5.1). I reported the bug on January 17.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal">On Wed, Feb 15, 2017 at 3:04 PM, Majewski, Steven Dennis (sdm7g) <<a href="mailto:sdm7g@eservices.virginia.edu" target="_blank">sdm7g@eservices.virginia.edu</a>> wrote:<o:p></o:p></p>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal">Yes, and the previous cases I’ve seen ( which have since been fixed ) have been where the document was originally parsed with correct character encoding, but that encoding wasn’t being preserved on some other <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">( xml or json ) internal transform. So that might be something to look for if it’s still happening in a new use case. <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<p class="MsoNormal">On Feb 15, 2017, at 3:54 PM, Reese, Terry P. <<a href="mailto:reese.2179@osu.edu" target="_blank">reese.2179@osu.edu</a>> wrote:<o:p></o:p></p>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">I’d be interested in the same thing (a sample file).  I’m familiar with the tools being used, and if the data is UTF8, then you shouldn’t see this problem unless the import
 is munging the data or encoding – which would be a much different problem.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">--tr</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><a name="m_-3701973514068415065__MailEndCompose"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> </span></a><o:p></o:p></p>
</div>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<div>
<p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">From:</span></b><span class="m-3701973514068415065apple-converted-space"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> </span></span><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank">archivesspace_users_group-bounces@lyralists.lyrasis.org</a>
 [<a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank">mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org</a>]<span class="m-3701973514068415065apple-converted-space"> </span><b>On Behalf Of<span class="m-3701973514068415065apple-converted-space"> </span></b>Majewski,
 Steven Dennis (sdm7g)<br>
<b>Sent:</b><span class="m-3701973514068415065apple-converted-space"> </span>Wednesday, February 15, 2017 3:50 PM<br>
<b>To:</b><span class="m-3701973514068415065apple-converted-space"> </span>Archivesspace Users Group <<a href="mailto:archivesspace_users_group@lyralists.lyrasis.org" target="_blank">archivesspace_users_group@lyralists.lyrasis.org</a>><br>
<b>Subject:</b><span class="m-3701973514068415065apple-converted-space"> </span>Re: [Archivesspace_Users_Group] Enumerations Findings</span><o:p></o:p></p>
</div>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Do you have a sample import file that fails this way ? <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Do you know if it still fail on current release ? <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">( and is bug reported on Jira ? ) <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">— Steve. <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<div>
<p class="MsoNormal">On Feb 15, 2017, at 3:25 PM, Lisa Calahan <<a href="mailto:lcalahan@umn.edu" target="_blank"><span style="color:purple">lcalahan@umn.edu</span></a>> wrote:<o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<div>
<div>
<p class="MsoNormal">I've also received the same UTF8 error when importing legacy accession records that have<span class="m-3701973514068415065apple-converted-space"> </span><b>valid</b>diacritical marks in the title and/or agent name.<span class="m-3701973514068415065apple-converted-space"> </span><o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Lisa<o:p></o:p></p>
</div>
</div>
</div>
<div>
<div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal">On Wed, Feb 15, 2017 at 2:17 PM, Reese, Terry P. <<a href="mailto:reese.2179@osu.edu" target="_blank"><span style="color:purple">reese.2179@osu.edu</span></a>> wrote:<o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-top:5.0pt;margin-right:0in;margin-bottom:5.0pt">
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">I guess my question would be – is your legacy data UTF8?  For whatever reason, I’ve found that historically, Archives have often used other charactersets when encoding their
 EAD files (though to be fair, I see this in MARC records as well; confusion between MARC8, ISO8859-1, and codepage 1252).  The simply solution (and this would maintain your characters) would be to convert the character set to UTF8.  Otherwise, even if you
 held on to these values – they wouldn’t display in any form that you could read; and in fact, that is what the error message is trying to tell you.  That as a UTF8 value, your data is going to be gibberish, regardless of if you keep it or not.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">--tr</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> </span><o:p></o:p></p>
</div>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<div>
<p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">From:</span></b><span class="m-3701973514068415065apple-converted-space"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> </span></span><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank"><span style="color:purple">archivesspace_users_group-bounces@lyralists.lyrasis.org</span></a><span class="m-3701973514068415065apple-converted-space"> </span>[mailto:<a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank"><span style="color:purple">archivesspace_users_group-bounces@lyralists.lyrasis.org</span></a>]<span class="m-3701973514068415065apple-converted-space"> </span><b>On
 Behalf Of<span class="m-3701973514068415065apple-converted-space"> </span></b>Stasiulatis, Suzanne<br>
<b>Sent:</b><span class="m-3701973514068415065apple-converted-space"> </span>Wednesday, February 15, 2017 3:12 PM</span><o:p></o:p></p>
</div>
<div>
<div>
<div>
<p class="MsoNormal"><br>
<b>To:</b><span class="m-3701973514068415065apple-converted-space"> </span>Archivesspace Users Group <<a href="mailto:archivesspace_users_group@lyralists.lyrasis.org" target="_blank"><span style="color:purple">archivesspace_users_group@lyralists.lyrasis.org</span></a>><br>
<b>Subject:</b><span class="m-3701973514068415065apple-converted-space"> </span>Re: [Archivesspace_Users_Group] Enumerations Findings<o:p></o:p></p>
</div>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
</div>
</div>
<div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">I totally agree that we shouldn’t have special characters if at all possible, but a large amount of our legacy data uses them. Especially in titles, staff want
 to use those characters as they are reflected on original materials.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">Suzanne</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif">From:</span></b><span class="m-3701973514068415065apple-converted-space"><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif"> </span></span><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif"><a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank"><span style="color:purple">archivesspace_users_group-bounces@lyralists.lyrasis.org</span></a><span class="m-3701973514068415065apple-converted-space"> </span>[<a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank"><span style="color:purple">mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org</span></a>]<span class="m-3701973514068415065apple-converted-space"> </span><b>On
 Behalf Of<span class="m-3701973514068415065apple-converted-space"> </span></b>Reese, Terry P.<br>
<b>Sent:</b><span class="m-3701973514068415065apple-converted-space"> </span>Wednesday, February 15, 2017 2:58 PM<br>
<b>To:</b><span class="m-3701973514068415065apple-converted-space"> </span>Archivesspace Users Group<br>
<b>Subject:</b><span class="m-3701973514068415065apple-converted-space"> </span>Re: [Archivesspace_Users_Group] Enumerations Findings</span><o:p></o:p></p>
</div>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">Why would you want to retain invalid special characters?  My guess is that one of the reasons for this error is that invalid characters would cause problems with indexing for
 search, as well as impact display and export.  I would think you’d want to use the error as a flag to identify data that needs to be corrected.  Or am I missing something?</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">--tr</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> </span><o:p></o:p></p>
</div>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<div>
<p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">From:</span></b><span class="m-3701973514068415065apple-converted-space"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> </span></span><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank"><span style="color:purple">archivesspace_users_group-bounces@lyralists.lyrasis.org</span></a><span class="m-3701973514068415065apple-converted-space"> </span>[<a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank"><span style="color:purple">mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org</span></a>]<span class="m-3701973514068415065apple-converted-space"> </span><b>On
 Behalf Of<span class="m-3701973514068415065apple-converted-space"> </span></b>Stasiulatis, Suzanne<br>
<b>Sent:</b><span class="m-3701973514068415065apple-converted-space"> </span>Wednesday, February 15, 2017 2:52 PM<br>
<b>To:</b><span class="m-3701973514068415065apple-converted-space"> </span>Archivesspace Users Group <<a href="mailto:archivesspace_users_group@lyralists.lyrasis.org" target="_blank"><span style="color:purple">archivesspace_users_group@lyralists.lyrasis.org</span></a>><br>
<b>Subject:</b><span class="m-3701973514068415065apple-converted-space"> </span>Re: [Archivesspace_Users_Group] Enumerations Findings</span><o:p></o:p></p>
</div>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">This also came up for me recently. If invalid special characters are present in the content titles, I get this error. I’m not sure quite how to adjust to accept
 those special characters.</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><image002.png><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:navy">Suzanne Stasiulatis<span class="m-3701973514068415065apple-converted-space"> </span></span></b><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:navy">|
 Archivist II<br>
Pennsylvania Historical and Museum Commission<span class="m-3701973514068415065apple-converted-space"><b> </b></span>| Pennsylvania State Archives<br>
350 North Street | Harrisburg, PA 17120-0090</span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:navy">Phone:<span class="m-3701973514068415065apple-converted-space"> </span><a href="tel:(717)%20787-5953" target="_blank"><span style="color:purple">717-787-5953</span></a></span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Verdana",sans-serif;color:#003E7E"><a href="http://www.phmc.pa.gov/" target="_blank"><span style="color:purple">http://www.phmc.pa.gov</span></a></span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Calibri",sans-serif;color:#17365D"><a href="mailto:sustasiula@pa.gov" target="_blank"><span style="color:purple">sustasiula@pa.gov</span></a></span><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D"> </span><o:p></o:p></p>
</div>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<div>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif">From:</span></b><span class="m-3701973514068415065apple-converted-space"><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif"> </span></span><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif"><a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank"><span style="color:purple">archivesspace_users_group-bounces@lyralists.lyrasis.org</span></a><span class="m-3701973514068415065apple-converted-space"> </span>[<a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank"><span style="color:purple">mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org</span></a>]<span class="m-3701973514068415065apple-converted-space"> </span><b>On
 Behalf Of<span class="m-3701973514068415065apple-converted-space"> </span></b>Majewski, Steven Dennis (sdm7g)<br>
<b>Sent:</b><span class="m-3701973514068415065apple-converted-space"> </span>Wednesday, February 15, 2017 2:36 PM<br>
<b>To:</b><span class="m-3701973514068415065apple-converted-space"> </span>Archivesspace Users Group<br>
<b>Subject:</b><span class="m-3701973514068415065apple-converted-space"> </span>Re: [Archivesspace_Users_Group] Enumerations Findings</span><o:p></o:p></p>
</div>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">We have run into the case that some EAD attribute values are required to be NMTOKENs, thus no embedded spaces or other disallowed characters. We replaced enumerations with embedded spaces with underscores. <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">This has only come to my attention in the last week or so, so I haven’t made a thorough investigation of which attributes or which enumerations this applies to — just fixed them as I’ve encountered that error. <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">So it may be intentional that it is using the non translated value. <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">( And I wouldn’t be surprised, if for simplicity, it may be over applying that rule in places where it’s not actually required. ) <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">— Steve. <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<div>
<p class="MsoNormal">On Feb 15, 2017, at 2:09 PM, Carlos Lemus <<a href="mailto:carlos.lemus@unlv.edu" target="_blank"><span style="color:purple">carlos.lemus@unlv.edu</span></a>> wrote:<o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<div>
<div>
<p class="MsoNormal">Hello,<o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">At UNLV Special Collections, we've been working on cleaning up our enumeration values because in many cases there were duplicates caused by imports (i.e value: linear_feet vs value: Linear feet vs Linear Feet). We wanted to stick as close
 as possible to ArchivesSpace standards and decided to make our enumeration values all lowercase seperated by an underscore and then merge any records with incorrect enumerations into that correct value (i.e value: linear Feet into linear_feet). We also have
 some custom enumerations such as: value: oversized_box, translation: Oversized Box; digital_file; Digital File<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">After we had that set up correctly, we had some findings and was wondering if anyone has experienced the same things or had a standard we could use. <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">1. When generating PDFs and EADs the enumeration values that were custom (such as the oversized_box) would come out as machine readable oversized_box instead of using our local en.yml value (located in the local plugin).<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">     This was something I found in the EAD serializer (<a href="https://github.com/archivesspace/archivesspace/blob/master/backend/app/exporters/serializers/ead.rb#L490" target="_blank"><span style="color:purple">https://github.com/archivesspace/archivesspace/blob/master/backend/app/exporters/serializers/ead.rb#L490</span></a>) and
 was able to create a temporary solution of generating it , but required altering the enumeration instead of referencing our file. I thought i'd point it out because anyone creating custom enumerations even with a translation in an en.yml  file would not see
 their change reflected in the EAD export. (I've attached an image reflecting this) Anyone experience this?<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">2. Another example of this case was in the container "type" attribute. Before something like Oversized Box would be export to EAD as is because that was it's value in the enumeration. After we changed the value correctly to oversized_box,
 it would export to the EAD container "type" as is and translate to the PDF as well. With some XSLT manipulation I was able to get it to show up as oversized box (shown in attachments). I've looked through <a href="https://www.loc.gov/ead/tglib/elements/container.html" target="_blank"><span style="color:purple">https://www.loc.gov/ead/tglib/elements/container.html</span></a><span class="m-3701973514068415065apple-converted-space"> </span>and
 cannot find an example of a two+ attribute value. <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Should attributes be machine readable (i.e oversized_box), human readable (Oversized Box), or does it even matter? Of course, exporting it as Oversized Box would be easiest to translate a user friendly version to the user. <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal">Excuse me for the lengthy post, I'm trying to be thorough with my explenation, but please let me know if you've come accross something similar or have a finite solution.<o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><br clear="all">
<o:p></o:p></p>
</div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt">Carlos Lemus</span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt">Application Programmer, Special Collections Technical Services</span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt">University Libraries, University of Nevada, Las Vegas</span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt"> </span><o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><i><span style="font-size:9.5pt;font-family:"Arial",sans-serif;color:#252525;background:white">How often have I said to you that when you have eliminated the impossible, whatever remains, however improbable, must be the truth? - Sherlock
 Holmes</span></i><o:p></o:p></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
<div>
<p class="MsoNormal"><enumeration_ead.PNG><containers_enum.PNG>_______________________________________________<br>
Archivesspace_Users_Group mailing list<br>
<a href="mailto:Archivesspace_Users_Group@lyralists.lyrasis.org" target="_blank"><span style="color:purple">Archivesspace_Users_Group@lyralists.lyrasis.org</span></a><br>
<a href="http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group" target="_blank"><span style="color:purple">http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group</span></a><o:p></o:p></p>
</div>
</div>
</blockquote>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
</div>
</div>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><br>
_______________________________________________<br>
Archivesspace_Users_Group mailing list<br>
<a href="mailto:Archivesspace_Users_Group@lyralists.lyrasis.org" target="_blank"><span style="color:purple">Archivesspace_Users_Group@lyralists.lyrasis.org</span></a><br>
<a href="http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group" target="_blank"><span style="color:purple">http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group</span></a><o:p></o:p></p>
</blockquote>
</div>
<div>
<p class="MsoNormal"><br>
<br clear="all">
<o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal">--<span class="m-3701973514068415065apple-converted-space"> </span><o:p></o:p></p>
</div>
<div>
<div>
<div>
<div>
<div>
<p class="MsoNormal"><br>
Head of Archival Processing<br>
<br>
University of Minnesota Libraries<br>
Archives and Special Collections<br>
Elmer L. Andersen Library, Suite 315<br>
222-21st Ave. S.<br>
Minneapolis MN 55455<br>
<br>
Phone: <a href="tel:(612)%20626-2531" target="_blank">612.626.2531</a><o:p></o:p></p>
</div>
</div>
</div>
</div>
</div>
</div>
<div>
<p class="MsoNormal">_______________________________________________<br>
Archivesspace_Users_Group mailing list<br>
<a href="mailto:Archivesspace_Users_Group@lyralists.lyrasis.org" target="_blank"><span style="color:purple">Archivesspace_Users_Group@lyralists.lyrasis.org</span></a><br>
<a href="http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group" target="_blank"><span style="color:purple">http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group</span></a><o:p></o:p></p>
</div>
</div>
</div>
</div>
</blockquote>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:10.5pt;font-family:"Menlo-Regular",serif">_______________________________________________<br>
Archivesspace_Users_Group mailing list<br>
</span><a href="mailto:Archivesspace_Users_Group@lyralists.lyrasis.org" target="_blank"><span style="font-size:10.5pt;font-family:"Menlo-Regular",serif;color:purple">Archivesspace_Users_Group@lyralists.lyrasis.org</span></a><span style="font-size:10.5pt;font-family:"Menlo-Regular",serif"><br>
</span><a href="http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group" target="_blank"><span style="font-size:10.5pt;font-family:"Menlo-Regular",serif;color:purple">http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group</span></a><o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><br>
_______________________________________________<br>
Archivesspace_Users_Group mailing list<br>
<a href="mailto:Archivesspace_Users_Group@lyralists.lyrasis.org">Archivesspace_Users_Group@lyralists.lyrasis.org</a><br>
<a href="http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group" target="_blank">http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group</a><o:p></o:p></p>
</blockquote>
</div>
<p class="MsoNormal"><br>
<br clear="all">
<o:p></o:p></p>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<p class="MsoNormal">-- <o:p></o:p></p>
<div>
<div>
<div>
<div>
<p class="MsoNormal"><br>
Head of Archival Processing<br>
<br>
University of Minnesota Libraries<br>
Archives and Special Collections<br>
Elmer L. Andersen Library, Suite 315<br>
222-21st Ave. S.<br>
Minneapolis MN 55455<br>
<br>
Phone: 612.626.2531<o:p></o:p></p>
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>